SVM(Support Vector Machine)을 이용한 recovery boiler에 대한 연구

Download Report

Transcript SVM(Support Vector Machine)을 이용한 recovery boiler에 대한 연구

`
SVM(Support Vector Machine)을
이용한 recovery boiler에 대한 연구
윤영필, 김미영, 이창준, 윤인섭*
Seoul National University
Process Systems & Safety Lab.
`
요약
• 비선형성 (non-linearity) 화학공정의 multivariable에 대한 영향을 알아보기 위해
다변량 통계분석 (multivariate data analysis)의 하나인 SVM(support vector
machine)을 이용함.
• SVM(support vector machine)은 학습속도가 매우 빠르고 입력값의 차원에 영향
을 받지 않으므로 비선형 데이터에 용이함.
• Recovery Boiler의 operation data를 SVM(support vector machine)통해
medeling하고 , 영향을 주는 입력 변수를 산출함.
•이를 통해 출력 변수에 영향을 multivariable을 control 할 수 있고, 이를 바탕으
로 SVM (support vector machine)를 이용해 비선형성 (non-linearity) 화학공정
을 control 할 수 있음.
Seoul National University
Process Systems & Safety Lab.
`
Support Vector Machine(1)
Second order polynomial hypersurface d(x) in input space
Mapping
Hyperplane in a feature space
z   ( x)
F : d ( z )  wT x  b
x1
x2
1 ( x )
 2 ( x)
x3
x1
3 ( x)
( x1 )
2
 4 ( x)
x2
( x2 ) 2
d ( x)
 5 ( x)
 6 ( x)
( x3 ) 2
 7 ( x)
x3
8 ( x)
x1 x2
b
 9 ( x)
x2 x3
1
x3 x1
Seoul National University
Process Systems & Safety Lab.
iF  sign ( d ( x ))
Support Vector Machine(2)
Vapnik에 의해 소개된 강력한 통계방법으로써, 통계적
학습 이론에서 유도한 학습 바이어스를 이용한 학습
알고리즘으로 훈련되는 고차원의 feature space 상의
선형식의 가상공간을 이용한다.
1. 명료한 이론적 근거를 기반으로 하여 입력으로부터 어떠한 학습방법을 이용
하는가에 대한 직관적인 해석을 제공.
2. 실제 응용 문제에서 높은 인식 성능을 발휘함.
3. 비선형 패턴 인식문제, 함수 회귀문제, HCI(Human –Computer Integration),
인공지능 등의 분야에서 크게 활용되고 있음.
Seoul National University
Process Systems & Safety Lab.
`
Support Vector Machine(3)
Kernel function
Nonlinear SVM 에서 이용하는 hyperplane equation
f ( x )   ( x) w  b
T
 ( x) 는 x 의 basis function로
p차원의
x 에서 m차원으로의 mapping이며,
실제로는 구체적인 형태를 알 필요는 없으므로 널리 알려진 kernel function
의 형태를 활용. 본 연구에서는 알려진 kernel function 중 “Polynomial
Kernel function”을 이용.
K ( xi , x j )  ( xi ' x j 1)r
Seoul National University
Process Systems & Safety Lab.
`
Support Vector Machine(4)
`
Support Vector Regression
• SVM을 Loss function을 이용하여 Regression으로 이용.
→ Support Vector Regression
• Loss function(  -Intensive Loss function)
Linear Regression의 경우,Intensive Loss function, Quadratic Loss function,
Huber Loss function을 이용.
Nonlinear Regression의 경우, Intensive Loss function을 이용 →
l
1 l l
*
*
max , * W ( , )  max , *   (i  i )(i  i )  xi  x j  i ( yi   )  i* ( yi   )
2 i 1 j 1
i 1
*
Seoul National University
Process Systems & Safety Lab.
Recovery Boiler 공정(1)
•
•
•
•
본 연구에서는 Recovery Boiler Process의 data set을 이용하여 SVM을
process modeling과 control에 적용함.
Recovery Boiler는 Kraft process의 일부로 나무에서 Cellulose pulp를 생산
하는 대표적인 공정이며, wood cooking으로부터 남은 잔여액을 Recovery
Boiler에서 태워 steam을 발생시키고 다른 chemical들은 회수함.
본 연구에서는 이 공정의 input variable는 15개로 설정하고 input variable에
따른 output variable(response variable)를 1개로 하여 약 2900여 개의
data variable을 이용함.
이 공정에서 얻어진 data set중 일부를 이용하여 비교적 정확한 model을 구
현하고, 이를 바탕으로 Recovery Boiler의 output variable과 이에 영향을 주
는 input variable의 관계를 알아봄.
Seoul National University
Process Systems & Safety Lab.
`
`
Recovery Boiler 공정(2)
Boiler Operational Variable, Unit
Input
Black liquor flow rate, t/h
15
Black liquor temp.
16
12,13,14
c
1,2,3,4
Dry solids percentage in the liquor, %
%SS
Dry solids flow rate, t/h
V Z SS
Primary air flow rate, t/h
V Z AP
o
c
T AP
Primary air pressure, mmH2O
P AP
Secondary air flow rate, t/h
V Z AS
o
c
T AS
Secondary air pressure, mmH2O
P AS
Tertiary air flow rate, t/h
V Z AT
Tertiary air temp.
Ou t pu t
T LP
P LP
Secondary air temp.
6,7,8
V Z LP
Black liquor pressure, mmH2O
Primary air temp.
9.10.11
o
Code
o
c
T AT
Tertiary air pressure, mmH2O
P AT
Steam drum pressure kg/cm2
P BL
Steam flow rate, t/h
VZ VG
Seoul National University
Process Systems & Safety Lab.
Colleting Point
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
`
결과(1)
Training data
SVM Regression
Model
Testing data(Input)
Testing data(output)
결과 비교! (MSE)
Seoul National University
Process Systems & Safety Lab.
Testing data(output)
`
결과(2)
실제 값
예측 값
MSE=0.1197
Seoul National University
Process Systems & Safety Lab.
`
결과(3)
Training data의 각 변수마다 (–2~2)의 변위를 더해줌.
Model
Testing data(output)
결과 비교! (MSE)
Testing data(output)
각 변수들이 Output에 어느정도 기여하는지 파악하여,
이를 이상진단, 최적화 및 제어에 활용함!!
Seoul National University
Process Systems & Safety Lab.
`
결과(4)
각 Input의 변위가 Output에 미치는 영향
12
10
8
MS E
6
4
2
0
1
2
3
4
5
6
7
8
9
10 11
12 13 14 15
input
1, 4, 5, 15 번 Input이 Output에 큰 영향을 미침.
Seoul National University
Process Systems & Safety Lab.
결론 및 제언
SVM regression을 이용한 output의 예측이 잘 맞고 있다.
또한, normalization을 이용하여 중요 input을 선별할 수 있다.
이상진단, 최적화, 제어 등에 활용함.
제 언
이상 데이터를 Classification 한 후, 이를 토대로 실제 데이터를 실
시간으로 Fault Detection 할 수 있을 것이다. 또한 중요 input을 제어함으
로써, Fault Diagnosis에 활용할 수 있을 것이다.
Seoul National University
Process Systems & Safety Lab.
`