資料 - 情報論的学習理論と機械学習 (IBISML)
Download
Report
Transcript 資料 - 情報論的学習理論と機械学習 (IBISML)
品質問題を解くプロセスデータ解析
技術:産業応用の現状と課題
京都大学
加納 学
Division of Process Control & Process Systems Engineering
Department of Chemical Engineering, Kyoto University
[email protected]
http://www-pse.cheme.kyoto-u.ac.jp/~kano/
機械学習と製造業
情報論的学習理論ワークショップ(IBIS)に初参加です.
生産システム・製造設備を対象とした研究は皆無でした.
原因推論
A.機械学習屋さんは製造業に興味がない.
B.製造業に機械学習の問題がない.
C.機械学習と製造業の接点がない.
製造業が抱える技術課題を紹介します.チャレンジして下さい.
ニッチな分野(?)なので,日本代表になれますよ.
2
Outline
製造業が抱える品質問題
様々な産業が抱える問題の共通点とは?
ソフトセンサーの産業応用事例
品質推定の現状と課題とは?
多変量統計的プロセス管理(MSPC)
異常検出の現状と課題とは?
まとめ
私は何を為すべきか?
3
Example 1: Steel
Blast Furnace
4
- Mission Minimize defects in steel
product, and improve
product yield.
Various Steel Products
Converter
Continuous Casting
Slab
Hot Rolling
Cold Rolling
Example 2: Silicon Wafer
- Mission Improve product qualities
such as flatness.
Inspection of flatness and
other product qualities.
Polycrystal
Silicon
Czochralski
Method
Single Crystal
Silicon
Polish, Etch, Wash
5
Example 3: Pharmaceutical
active substances
- Mission Realize Real-Time-Release
without quality inspection.
washing
mixing
tableting
coating
packaging
excipients
granulation
Quality by Design (QbD)
Paradigm shift
from “quality by inspection”
to “quality by design”.
Quality should be built into
a product with a thorough
understanding of the
product and process.
6
Example 4: Semiconductor
7
- Mission Improve product yield.
Virtual Metrology
Product quality assurance through run-to-run control
based on estimation (virtual measurement)
(Su et al., Cont. Eng. Prac., 2007)
何を為すべきか?
対象は,多工程・複雑・非線形・動的プロセス.
やるべきことは,3つ.
製品品質の予測
品質・歩留りの改善
異常の検出
製品品質と運転条件を関連づけるモデルを構築したい.
データがあるなら,モデルを構築すればいいだけ.
今更,取り組む価値のある,どんな問題があるの?
8
Outline
製造業が抱える品質問題
様々な産業が抱える問題の共通点とは?
ソフトセンサーの産業応用事例
品質推定の現状と課題とは?
多変量統計的プロセス管理(MSPC)
異常検出の現状と課題とは?
まとめ
私は何を為すべきか?
9
ソフトセンサーの適用事例
昭和電工との共同研究プロジェクト
蒸留塔における製品濃度の推定
製品品質をオンラインで推定できるソフトセンサーを開
発し,プロセスの限界運転を実現する.推定値はオプ
ティマイザおよびモデル予測制御システムで利用する.
AIChE J., 55, 1754-1765 (2009)
J. Proc. Cont., 19, 179-186 (2009)
計測自動制御学会論文集, 44, 317-324 (2008)
計測自動制御学会論文集, 43, 869-876 (2007)
J. Chem. Eng. Japan, 37, 422-428 (2004)
10
ソフトセンサーに関する研究の動向
# articles
40
30
20
10
PLS
ANN
SSID
SVM/SVR
0
1
9
19
3
9
19
5
9
19
7
9
19
9
9
19
Year
1
0
20
3
0
20
5
0
20
ニューラルネット(ANN)の利用が目立つ.
直近5年くらいで,カーネル法(SVRなど)が躍進.
PLS(partial least squares)は外せない.
部分空間同定(SSID)は少数.
11
ソフトセンサーの現実
12
Partial Least Squares (PLS)
出力変数と潜在変数(入力変数の線形結合)との
内積が最大となるように,潜在変数を決定する.
OLS
PCR
PLS
r y yˆ
2
z
2
y yˆ
y
T
y yˆ
y yˆ
yˆ
1
N 1
z
cos
2
y , z y z cos
PLSはOLSとPCRの中間的な性質を持つ.
出力変数との相関および入力変数間の相関を
同時に考慮して,適切な潜在変数を決定する.
13
石油化学プラント
14
対象とした連続蒸留塔
15
1. T431 tray #29 temp.
2. T431 bottom temp.
3. T431 top temp.
4. T431 tray #37 temp.
5. T432 tray #129 temp.
エチレン 6. Flow rate from T432 to T431
7. T431 reboiler flow rate
8. Product ethylene flow rate
9. T432 reflux flow rate
10. T432 internal reflux flow rate
11. T432 purge flow rate
12. T432 reflux ratio
13. T432 top pres.
14. T431 feed ethane conc.
15. C351 #2 discharge pres.
16. C351 #2 discharge temp.
17. C351 #4 suction pres.
18. V359 level (cooling propylene)
製品エチレン中の不純物エタン濃度を推定する
16
製品組成ソフトセンサー
不純物濃度
500
400
300
200
100
0
0
200
400
600
推定誤差
100
measurements
estimates
800
1000
目標管理幅
50
0
-50
-100
0
200
400
600
800
極めて高い推定精度を実現!
1000
推定誤差の原因
推定誤差 = 測定値 – 推定値
原因はソフトセンサーか,それとも分析機器か?
分析機器
サンプリングラインの閉塞等のトラブル
ソフトセンサー
入力変数選択の失敗
運転条件の変動
触媒劣化や装置汚れなど,プロセスの経時変化
推定誤差の原因を突き止めることはできるか?
17
PLSを利用したMSPC
18
入力変数が張る多次元空間において,モデル構築に利用した
運転データが存在する領域内でのみ,推定モデルおよびその
推定値を信頼できる.
現在の運転状態が領域内にある
かどうかをオンライン監視し,なけ
れば推定値を制御目的等に利用
しない.
Error
detected by Q
LV1
分析機器の異常も検出可能.
PLS-based MSPC
LV2
2
detected by T
19
適用結果
(B)
Ethane conc.
濃度
(A)
(C)
measurements
estimates
100
50
0
500
1000
1500
2000
2500
0
500
1000
1500
2000
2500
0
500
1000
1500
2000
2500
0
500
1000
1500
2000
2500
Error
誤差
20
0
-20
T
200
0
300
200
Q
監視指標
2
400
100
0
Time [hour]
推定値の信頼性を評価できるシステムを実現!
保守負荷の低減を目指して
Dynamic PLS
部分空間同定・二段階部分空間同定
ニューラルネットワーク
十分な精度のモデルを構築することができたとして,その
精度を維持できるかが産業応用上の深刻な問題.
技術者不足もあり,モデルの再構築は事実上困難.
Recursive PLS
逐次的にモデルを更新するため,直近の運転状態に過
度に適応してしまう.
Just-In-Timeモデル
測定値が得られる毎にデータベースを更新し,データベ
ースに基づいて,局所的なモデルを構築する.
20
Just-In-Timeモデルの概念
Just-In-Timeモデル
Query点近傍のデータを集め,それらのデータのみを用
いて,局所的な(線形)モデルを構築する.
21
相関型JITモデルへ
22
相関型Just-In-Time (CoJIT) モデル
従来のJITモデルでは,「距離」のみに基づいて近傍が決定さ
れるため,相関関係は一切考慮されない.
相関関係を考慮すれば,より優れたモデルが構築できる.
(藤原ら, SICE論文集, 2008)
相関型JITの産業応用事例
23
分解ガソリン精留塔
昭和電工大分工場
ガソリン中アロマ濃度
MPC制約条件
ラボで1回/日分析
→過剰に余裕のある運転
入力変数選択
8変数選択(全19変数)+
4時間前の分解炉コイル出口温度
データ
2006/4/30 ~ 2007/12/25(600日間)
(Fujiwara et al., AIChE J., 2009)
相関型JITの産業応用事例
相関型JITモデリングにより高い予測性能を達成!
24
ソフトセンサーのまとめ
産業応用上重要な手法はPLS.
1990年代初めに一世を風靡したANNはほぼ死滅.
カーネル法など新しく高度な手法が次々と提案されているが
,本気で産業応用を目指すなら,取り組むべき課題は,プロ
セス特性の変化にいかに対応するか.
自動的にモデルを更新したいが,モデル更新に使って良い
データと使ってはいけないデータを自動的に判別できるか?
25
Outline
製造業が抱える品質問題
様々な産業が抱える問題の共通点とは?
ソフトセンサーの産業応用事例
品質推定の現状と課題とは?
多変量統計的プロセス管理(MSPC)
異常検出の現状と課題とは?
まとめ
私は何を為すべきか?
26
大小が普通でないものを見付ける
身長と体重に上下限を設定してみましょう.
身長
体重
a. これで完璧だ!
b. いや,もっと凄い方法がある
27
関係が普通でないものを見付ける
身長と体重には正の相関関係があることを利用して,
管理限界を設定してみましょう.
身長
体重
これが,多変量統計的プロセス管理の核心です
28
PCAを利用したSPC
残差
Control Charts
Q による検出
NOC領域
T2
PC1
Q
PC2
T2
Q
2
T による検出
規格化された主成分得点の二乗和
残差の二乗和(SPE)
(Jackson and Mudholkar, 1979)
29
30
異常原因の特定
xˆ xPP
T
Q statistic
P
Q
2
ˆ
( xk xk )
Contribution
Reconstructed data
Contribution Plot
Variables
k 1
Contribution to Q
cont
k
2
( x k xˆ k )
<例>
Qで異常検出!
↓
寄与プロットによると,
#2熱電対での温度異常が原因
↓
冷却装置の故障を確認・対応
PCAを利用したSPC
Operation Data
X1
31
Control Charts
T2
X2
Q
Time
Contribution Plot
Time
Contrib
XM
Variables
MSPCのまとめ
産業応用上重要な手法はPCA.
異常検出性能の向上は,ICAやSVM,ウェーブレット解析な
どを適材適所で利用することによって達成される.
ここでも,プロセス特性の変化にいかに対応するかが重大な
問題となっている.
32
Outline
製造業が抱える品質問題
様々な産業が抱える問題の共通点とは?
ソフトセンサーの産業応用事例
品質推定の現状と課題とは?
多変量統計的プロセス管理(MSPC)
異常検出の現状と課題とは?
まとめ
私は何を為すべきか?
33
まとめ
製造プロセスの外観は異なっても,品質実現力強化の観点
から見れば,抱えている課題は類似している.
時間的に変化するプロセス特性(生産量変更,原料変更,メ
ンテナンスによる急変もある)へ対応しなければならない.
やたら複雑な手法で性能を改善したと主張する論文が多い
が,現実の問題を見ていないのではないか?
合目的的データ解析で現場の問題に挑もう!
34
35
基礎研究と応用研究
Basic Research 基礎研究
Applied
Research
Non-Applied
応用研究
非応用
Don’t
Non-Basic 非基礎
基礎研究と応用研究
基礎研究とはブレークスルーを生み出す研究である.ブレー
クスルーの対立概念はインクリメンタルである.これを「非基
礎」といおう.
応用研究とは,人類の持つ知見を人類にとって有用な知見
に変換する研究である.応用の対立概念はしたがって「非応
用」である.当然のことながら,応用研究の中にも基礎研究
は存在し,逆も真である.
我々は第IV象限の研究を行わないこととしよう.
「国立環境研究所のこれから」,市川惇信,1992
Don’t
36
有用性へのこだわり
知識ある者は理解されるよう努力する責任がある.
素人は専門家を理解するために努力すべきである,あるい
は専門家は専門家と通じれば十分であるなどとすることは,
野卑な傲慢である.
大学や研究所の内部においてさえ,残念ながら今日珍しくな
いそのような風潮は,彼ら専門家自身を無益な存在とし,彼
らの知識を学識から卑しむべき衒学に貶めるものである.貢
献に責任をもつためには,自らの産出物すなわち知識の有
用性に強い関心をもたなければならない.
「経営者の条件」,P.F. Drucker
37
統計的モデル vs. 物理モデル
製造プロセスを対象とするかぎり,物理モデルが王道.
Socrates:”およそ理論を無視したものなら,そのようなもの
を技術とは呼ばないよ.”(「ゴルギアス」 ,Plato)
Statistical model
Black box
data-based
Gray box
integration
K.K.D.
White box
経験・勘・度胸 model-based
Physical model
38