Transcript oshiro2

「わかりやすいパターン認識」 第5章:特徴の評価とベイズの誤り確率 5.1

5.2

特徴の評価 クラス内分散・ クラス間分散比 5月16日(金) 大城 亜里沙

5.1 特徴の評価

認識系の性能向上のために  認識性能は、前処理部、特徴抽出部、認識部を 含めた認識系全体の評価尺度であるから、認識 性能を改善するためには、性能を低下させた原 因が認識系のどの処理部にあるのかを明確にし なくてはならない。 5 前処理部 入力パターン X= ( X 1 , X 2 , … , X d ) 認識部 特徴抽出部 認識演算部 照合 識別辞書 5 出力

特徴の評価の例(1)  クラスが特徴空間上で完全に分離されている のに認識率が悪い場合 X 2 ω 1 ω 2 X 1 識別部を再設計(識別関数の学習)

特徴の評価の例(2)  クラスの分布間に重なりがある場合 X 2 ω 2 ω 1 X 1 特徴抽出部を再設計(特徴の評価)

特徴評価のまとめ

 特徴抽出部を設計する際に、あらかじめ特 徴の評価(特徴ベクトルの評価)を行うこと は極めて重要である。  特徴が適切でなければ高精度の認識系は 実現できない。  特徴の良し悪しはクラス間分離能力によっ て評価できる。

5.2 クラス内分散・クラス間分散比

クラス間分離度による評価  クラス間の分離を高精度で行うためには、 特徴空間上で同じクラスのパターンはなる べく接近し、異なるクラスのパターンはなる べくはなれるような分布をするのが望まし い。 クラス内分散・クラス間分散比

クラス内分散・クラス間分散比  クラス内分散-クラスの平均的な広がりを表す。 

w

2  1

n i c

    1

X

i

(

X

m i

)

t

(

X

m i

)   クラス間分散-クラス間の広がりを表す。 

B

2  1

n i c

  1

n i

(

m i

m

)

t

(

m i

m

) クラス内分散・クラス間分散比

J

    2

B

2

W

大きいほど良い。

クラス内分散・クラス間分散比の欠点  多クラスの問題に対しては、評価値が必ずしも 実際の分布の分離度を反映していない。 x 2 x 2 x 1 x 1 図 クラス内分散・クラス間分散比が同じ事例 分布の重なりを考慮しなければならない。 ベイズ誤り確率