PPT - 同志社大学

Download Report

Transcript PPT - 同志社大学

遺伝的アルゴリズムを用いた特徴選択
によるパターン認識
同志社大学
同志社大学
○ 同志社大学大学院
三木 光範
廣安 知之
永松 秀人
研究背景

商品管理システムの現状
 バーコードが主流
 タグ自体にコストがかかる
 特殊な商品(多品種少量)を扱うのが困難

タグの不要なシステム
 販売時に商品を撮影しデータベース上の
商品画像と比較する
 画像認識により商品管理を行う
画像認識による商品管理システム

アクセサリの商品管理
 撮影時の置き方によって同一物体が異なる
見え方をする際の画像認識
画像認識のための処理

前処理部
 2値化

特徴量抽出部
 特徴量データの抽出

識別部
 特徴量データベースとの
マッチングにより識別
特徴量を用いた識別

最も単純な識別
 すべての特徴量データを用いた識別
 特徴量は撮影条件,対象物体に依存
 同一物体が異なる見え方を示す場合もある

すべてのデータが識別に用いられるとは
限らない
特徴量

幾何学的特徴量→形状に関する特徴量

統計的特徴量 →色に関する特徴量
特徴量抽出例(変化なし)

例:指輪
特徴量
面積
撮影例2
誤差(%)
2437
2787
1.8
0.6548
0.6352
3
外周囲長
342.9
344.4
0.4
全周囲長
605.2
607.6
0.4
モーメント
撮影例1
撮影例 1 撮影例 2
誤差:撮影例1を基準としたときの
撮影例2の変化量
特徴量抽出例(変化あり)

例:ネックレス
特徴量
面積
撮影例1
撮影例2
撮影例 1 撮影例 2
誤差(%)
16110
17237
7
モーメント
0.3895
0.5219
34
外周囲長
1369.8
2035.5
48
全周囲長
3775.8
4490.2
19
誤差:撮影例1を基準としたときの
撮影例2の変化量
特徴量データ
ある対象物体,ある特徴量で
変動が大きくなるものが存在
 信頼性の高いデータと
信頼性の低いデータに分別される


面積
周囲長
安定
不安定
信頼性を考慮したマッチングが必要
 重み係数wを定義
最適な重み係数を決定する
最適化問題
重み係数
特徴量1 特徴量2 特徴量3
・・・ 特徴量j
Item 1
0
1
1
・・・
0
Item 2
1
0
0
・・・
1
:
Item i
:
:
:
・・・
:
w(i,1)
w(i,2)
w(i,3)
・・・
w(i,j)
例: 候補数1000個 特徴量数30個
重み係数の組み合わせは2の30乗
加えて1000候補に対して決定する
遺伝的アルゴリズム(GA)を用いる
遺伝的アルゴリズム(GA)
生物の進化を模倣した最適化アルゴリズム
 母集団に対して,遺伝的操作を繰り返し適用
 多点探索により,大域的な探索に優れている

個体
母集団
GAを用いた特徴選択

識別に最適な重み係数の組み合わせを
GAで決定する
画像認識問題の定式化
重み係数wの最適な組み合わせを決定する
 wの値を並べてNビットの2進記号列を遺伝子型
 適合度により候補が決定

X i:データベース上の候補 Z :入力と比較される
データベース上の候補
Y :入力画像
size :使用する特徴量の数
実験

実画像を2種類用意
 特徴量データベース,入力画像
対象画像内訳
特徴量データ
分類
個数(個)
指輪
10
ピン
9
ネックレス
6
その他
6
合計
31
幾何学的
特徴量
2値画像
統計的
特徴量
オリジナル画像
画像例
特徴量一覧


幾何学的特徴量
面積
パターン幅
全周囲長
2次モーメント
円相当径
包絡周囲長
絶対最大長
外周囲長
丸さの度合い
円形度
フェレ長
切片長
尖状度
投影長
フラクタル次元
最大弦長
等分径
分散
尖度
標準偏差
統計的特徴量
平均値
歪度
GAパラメータ
個体数
100
設計変数(特徴量数)
39
染色体長
39
交叉率
0.6
交叉法
2点交叉
選択法
トーナメント選択
トーナメントサイズ
突然変異率
4
0.025(=1/39)
評価方法

実験結果の評価法
 入力画像が候補の何番目に提示されたか?
適合度
入力画像
18.889119
第一候補
6.812660
第二候補
実験結果
87%の確率で一意に識別可能
 全ての特徴量を使用した識別と比較して
約20%の性能向上

識別例
特徴量の使用度合い

面積
 比較的どのような
指輪
100%(8/8)
ピン
100%(9/9)
対象においても安定 ネックレス
その他

周囲長
 形が変化する
対象では不安定
66%(4/6)
100%(4/4)
指輪
87%(7/8)
ピン
77%(7/9)
ネックレス
16%(1/6)
その他
100%(4/4)
識別に有効な特徴量を自動的に決定
まとめ

GAを用いた特徴選択による画像認識の提案

アクセサリを用いた実験
 87%の確率で一意に識別可能
 特徴量を選択しない場合と比較して
20%の性能向上

同一物体が異なる見え方を示す場合
(特徴量が変動する条件下)において有効
 人の顔認識等への応用
質疑応答
パターン認識

パターン認識問題
 観測されたパターンを,あらかじめ定められた
複数の概念のうちの一つに対応させる処理

画像認識
 指紋認証,etc

音声認識
 音声ワープロ,etc

優れた認識技術の開発
特徴選択

人間は優れた画像認識機能を有する
 特徴を選択的に抽出し,統合する

特徴選択
 与えられた特徴量の中から,識別に有用な
特徴量の組み合わせを選択する
 識別処理における計算コストの低減
 識別能力の向上
マッチングのフローチャート

商品ごとに最適な
重み係数が存在
 商品一つ一つに
対してGAを適用

入力画像Yと
データベース上の
各候補 X を順に
i
比較する
Xi
マッチング方法
商品A
商品B
周囲長 面積 平均値 ・・・ 分散
入力画像と前処理

撮影条件
 バックライト上に配置
 カメラ位置は固定
 商品の置き方は自由

前処理
 2値化
商品例(指輪)
商品例(ネックレス)
商品例(ピン)
商品例(その他)
認識例
その他
ピン
識別部におけるマッチング手法
テンプレートマッチング
基準となる画像と入力画像との重ね合わせ
特徴量を用いたマッチング
特徴量データの比較によるマッチング
マッチングの概念
誤差が大きすぎるのは変動の激しい特徴量
DBデータ1
110100
DBデータ2
011011
似通ったデータのみを用いてマッチングを行う
人間によるマッチング結果
特徴量データだけによるマッチング
人間・GAともに認識できる
それぞれの商品の特徴量
データに違いが存在
pin-01を入力
人間
GA
第一候補
pin-01
pin-01
第二候補
pin-02
etc-02
ring-04を入力
人間
pin-02を入力
第一候補
GA
第一候補 ring-03 ring-03
第二候補 ring-01 ring-01
人間
GA
pin-02
pin-02
第二候補 Necklace-02 Necklace-01
フラクタル次元

次元の概念
 元の図形をn分割し,できた相似な図形を
m,次元をDとする
log元の図形と相似な図形 の数
D  logn m 
log等分割した数
直線: log5 5  1
正方形: log5 25  2
フラクタル次元

次元の概念を非整数まで拡張したもの
直線は1次元
正方形は2次元
立方体は3次元
コッホ図形は1.262次元
log10 4
log3 4 
 1.262
log10 3
コッホ図形
円形度,尖状度,丸さの度合い

円形度
 真円で1となり,複雑なほど0に近づく
(絶対最大長) 2 

面積
4

尖状度
 正方形,真円で1となり,とがっているほど小さ
くなる

4  面積
(周囲長) 2
丸さの度合い
 真円で1となり,複雑なほど大きくなる
パターン幅
絶対最大長
歪度,尖度

歪度
 濃度ヒストグラムの形状が対称な形からどれだけ
ずれているかを表したもの
n 1
S

 (i   )
i 0
3
P(i )
3
尖度
 濃度ヒストグラムの分布がどれだけ平均値の回り
に集中しているかを表したもの
n 1
K
P(i) :濃度ヒストグラム

:平均値
 (i   )
i 0
4
P(i )
4
 :標準偏差
評価関数
未知の入力 item X
特徴量 w1,w2,w3
候補 A,B,C
適合度
Db  Dc
3
Da  1
入力をAとしたとき,他の候補(B,C)と比べて
どれだけ離れているか?
評価関数
未知の入力 item X
特徴量 w1,w2,w4
候補 A,B,C
適合度
Da  Dc
3
Db  1
入力をBとしたとき,他の候補(B,C)と比べて
どれだけ離れているか?