発表資料

Download Report

Transcript 発表資料

ICML 2006 読む会資料
†
Online Decoding of Markov Models
under Latency Constraints
Mukund Narasimhan,
Paul Viola,
Michael Shilman @ Microsoft Corp.
論文紹介者: 中田貴之 @ NEC
† Appearing in proceedings of the 23 rd International Conference
on Machine Learning, Pittsburgh, PA, 2006.
はじめに
Viterbiアルゴリズムはlinear-chain Markov Modelsをdecodingする
のに効率的で最適な手法である
しかし,状態を推定するためには全入力データを観測する必要があ
りオンラインアルゴリズムでの適用が難しい
固定windowを用いると, 広いwindowはAccuracyが上がるが
latencyが大きくなる
そこでAccuracy と Latency のトレードオフを考慮する手法を提案
応用例は,ネットワークのパケットストリームを解析し,早期に悪意あ
る行動を検出するアプリケーションなど
2
準備
S = {s1, s2 , . . . , sk} : マルコフモデルの状態
Sn : 長さ n の状態系列
観測系列 o が与えられたときの状態系列 s = s(0)s(1)s(2) . . . s(n−1) の確率 (for
a linear-chain CRF) :

ポテンシャル関数 :
 f ∈F : 特徴を表す関数 , lf : 重み
3
Viterbi アルゴリズム
(for Decoding CRFs)
最適状態系列(長さ t +1,最終状態 r ∈ S) のスコア

前から後へ再帰的に計算
最適状態系列(全観測データ) のスコア
最適状態(最終時刻 n )
最適状態系列(後から前へ再帰的に計算)
4
Viterbi アルゴリズム
(for Decoding CRFs)
(cont’d)
例
図 1.
最終時刻 4 の最適状態 C から後ろ向きに最適状態系列(緑)を求める
5
LatencyとAccuracyのトレードオフ
- 1. Simple Chunking 時刻 3 までのデータから求まる最適状態
固定Windowから
求まる最適状態
(誤り)
サイズ 3の固定Window
図 2.
6
LatencyとAccuracyのトレードオフ
- 2. Pruning by Transitive Closure -
時刻 3 までのデータ
から求まる最適状態
図 3.
時刻 3 を観測した時点で時刻 0 と 1 の状態は C C に一意に確定
それ以前の後ろ向きポインタを捨ててよい
7
LatencyとAccuracyのトレードオフ
- 3. Online Step (提案手法1) 時刻 T > t0 までの観測データが得られたとき,時刻 t0 に状態 a となる確率
時刻 T に状態 b のとき,
到達可能な時刻 t0 の状態
: 時刻 t0 の状態推定の不確かさを表す関数
以下を満たす T を求める( l : トレードオフのパラメータ)
min
Accuracy
Latency
時刻 t0 の状態の推定の精度を評価している
8
LatencyとAccuracyのトレードオフ
- 4. Online Variable Window (提案手法2) 時刻 T において状態 b の代わりに状態 a を選んだ場合の損失関数
(状態系列 s(t0). . . s(T) における推定結果の異なり数を損失とする):
時刻 T において状態 a を選んだ場合の期待損失

時刻 T に状態 b のと
き, 時刻 T - k の状態
期待損失を最小化する状態 a
以下を満たす T を求める( l : トレードオフのパラメータ)
min LossT + l・(T − t0)
Accuracy
Latency
時刻 t0,…,T の状態系列の推定の精度を評価している
9
実験結果
latency-error-rates

y 軸はViterbiアルゴリズム(最適)に対する精度の減少度を表す
図 5.
10
実験結果
(cont’d)
Online Step アルゴリズムにおいて,状態の推定精度の減少度を 0.1% とする
ために必要な追加観測データ数
図 6.
11
まとめ
Online Step および Online Variable Window アルゴリズムが,固定
Windowと比較して高い性能を発揮することを示した.
これらのアルゴリズムを用いると少ないリソースで Viterbiアルゴリズムに近
い性能が得られる
12