Transcript PPT - 同志社大学
遺伝的アルゴリズムを用いた特徴選択 によるパターン認識 同志社大学 同志社大学 ○ 同志社大学大学院 三木 光範 廣安 知之 永松 秀人 研究背景 商品管理システムの現状 バーコードが主流 タグ自体にコストがかかる 特殊な商品(多品種少量)を扱うのが困難 タグの不要なシステム 販売時に商品を撮影しデータベース上の 商品画像と比較する 画像認識により商品管理を行う 画像認識による商品管理システム アクセサリの商品管理 撮影時の置き方によって同一物体が異なる 見え方をする際の画像認識 画像認識のための処理 前処理部 2値化 特徴量抽出部 特徴量データの抽出 識別部 特徴量データベースとの マッチングにより識別 特徴量を用いた識別 最も単純な識別 すべての特徴量データを用いた識別 特徴量は撮影条件,対象物体に依存 同一物体が異なる見え方を示す場合もある すべてのデータが識別に用いられるとは 限らない 特徴量 幾何学的特徴量→形状に関する特徴量 統計的特徴量 →色に関する特徴量 特徴量抽出例(変化なし) 例:指輪 特徴量 面積 撮影例2 誤差(%) 2437 2787 1.8 0.6548 0.6352 3 外周囲長 342.9 344.4 0.4 全周囲長 605.2 607.6 0.4 モーメント 撮影例1 撮影例 1 撮影例 2 誤差:撮影例1を基準としたときの 撮影例2の変化量 特徴量抽出例(変化あり) 例:ネックレス 特徴量 面積 撮影例1 撮影例2 撮影例 1 撮影例 2 誤差(%) 16110 17237 7 モーメント 0.3895 0.5219 34 外周囲長 1369.8 2035.5 48 全周囲長 3775.8 4490.2 19 誤差:撮影例1を基準としたときの 撮影例2の変化量 特徴量データ ある対象物体,ある特徴量で 変動が大きくなるものが存在 信頼性の高いデータと 信頼性の低いデータに分別される 面積 周囲長 安定 不安定 信頼性を考慮したマッチングが必要 重み係数wを定義 最適な重み係数を決定する 最適化問題 重み係数 特徴量1 特徴量2 特徴量3 ・・・ 特徴量j Item 1 0 1 1 ・・・ 0 Item 2 1 0 0 ・・・ 1 : Item i : : : ・・・ : w(i,1) w(i,2) w(i,3) ・・・ w(i,j) 例: 候補数1000個 特徴量数30個 重み係数の組み合わせは2の30乗 加えて1000候補に対して決定する 遺伝的アルゴリズム(GA)を用いる 遺伝的アルゴリズム(GA) 生物の進化を模倣した最適化アルゴリズム 母集団に対して,遺伝的操作を繰り返し適用 多点探索により,大域的な探索に優れている 個体 母集団 GAを用いた特徴選択 識別に最適な重み係数の組み合わせを GAで決定する 画像認識問題の定式化 重み係数wの最適な組み合わせを決定する wの値を並べてNビットの2進記号列を遺伝子型 適合度により候補が決定 X i:データベース上の候補 Z :入力と比較される データベース上の候補 Y :入力画像 size :使用する特徴量の数 実験 実画像を2種類用意 特徴量データベース,入力画像 対象画像内訳 特徴量データ 分類 個数(個) 指輪 10 ピン 9 ネックレス 6 その他 6 合計 31 幾何学的 特徴量 2値画像 統計的 特徴量 オリジナル画像 画像例 特徴量一覧 幾何学的特徴量 面積 パターン幅 全周囲長 2次モーメント 円相当径 包絡周囲長 絶対最大長 外周囲長 丸さの度合い 円形度 フェレ長 切片長 尖状度 投影長 フラクタル次元 最大弦長 等分径 分散 尖度 標準偏差 統計的特徴量 平均値 歪度 GAパラメータ 個体数 100 設計変数(特徴量数) 39 染色体長 39 交叉率 0.6 交叉法 2点交叉 選択法 トーナメント選択 トーナメントサイズ 突然変異率 4 0.025(=1/39) 評価方法 実験結果の評価法 入力画像が候補の何番目に提示されたか? 適合度 入力画像 18.889119 第一候補 6.812660 第二候補 実験結果 87%の確率で一意に識別可能 全ての特徴量を使用した識別と比較して 約20%の性能向上 識別例 特徴量の使用度合い 面積 比較的どのような 指輪 100%(8/8) ピン 100%(9/9) 対象においても安定 ネックレス その他 周囲長 形が変化する 対象では不安定 66%(4/6) 100%(4/4) 指輪 87%(7/8) ピン 77%(7/9) ネックレス 16%(1/6) その他 100%(4/4) 識別に有効な特徴量を自動的に決定 まとめ GAを用いた特徴選択による画像認識の提案 アクセサリを用いた実験 87%の確率で一意に識別可能 特徴量を選択しない場合と比較して 20%の性能向上 同一物体が異なる見え方を示す場合 (特徴量が変動する条件下)において有効 人の顔認識等への応用 質疑応答 パターン認識 パターン認識問題 観測されたパターンを,あらかじめ定められた 複数の概念のうちの一つに対応させる処理 画像認識 指紋認証,etc 音声認識 音声ワープロ,etc 優れた認識技術の開発 特徴選択 人間は優れた画像認識機能を有する 特徴を選択的に抽出し,統合する 特徴選択 与えられた特徴量の中から,識別に有用な 特徴量の組み合わせを選択する 識別処理における計算コストの低減 識別能力の向上 マッチングのフローチャート 商品ごとに最適な 重み係数が存在 商品一つ一つに 対してGAを適用 入力画像Yと データベース上の 各候補 X を順に i 比較する Xi マッチング方法 商品A 商品B 周囲長 面積 平均値 ・・・ 分散 入力画像と前処理 撮影条件 バックライト上に配置 カメラ位置は固定 商品の置き方は自由 前処理 2値化 商品例(指輪) 商品例(ネックレス) 商品例(ピン) 商品例(その他) 認識例 その他 ピン 識別部におけるマッチング手法 テンプレートマッチング 基準となる画像と入力画像との重ね合わせ 特徴量を用いたマッチング 特徴量データの比較によるマッチング マッチングの概念 誤差が大きすぎるのは変動の激しい特徴量 DBデータ1 110100 DBデータ2 011011 似通ったデータのみを用いてマッチングを行う 人間によるマッチング結果 特徴量データだけによるマッチング 人間・GAともに認識できる それぞれの商品の特徴量 データに違いが存在 pin-01を入力 人間 GA 第一候補 pin-01 pin-01 第二候補 pin-02 etc-02 ring-04を入力 人間 pin-02を入力 第一候補 GA 第一候補 ring-03 ring-03 第二候補 ring-01 ring-01 人間 GA pin-02 pin-02 第二候補 Necklace-02 Necklace-01 フラクタル次元 次元の概念 元の図形をn分割し,できた相似な図形を m,次元をDとする log元の図形と相似な図形 の数 D logn m log等分割した数 直線: log5 5 1 正方形: log5 25 2 フラクタル次元 次元の概念を非整数まで拡張したもの 直線は1次元 正方形は2次元 立方体は3次元 コッホ図形は1.262次元 log10 4 log3 4 1.262 log10 3 コッホ図形 円形度,尖状度,丸さの度合い 円形度 真円で1となり,複雑なほど0に近づく (絶対最大長) 2 面積 4 尖状度 正方形,真円で1となり,とがっているほど小さ くなる 4 面積 (周囲長) 2 丸さの度合い 真円で1となり,複雑なほど大きくなる パターン幅 絶対最大長 歪度,尖度 歪度 濃度ヒストグラムの形状が対称な形からどれだけ ずれているかを表したもの n 1 S (i ) i 0 3 P(i ) 3 尖度 濃度ヒストグラムの分布がどれだけ平均値の回り に集中しているかを表したもの n 1 K P(i) :濃度ヒストグラム :平均値 (i ) i 0 4 P(i ) 4 :標準偏差 評価関数 未知の入力 item X 特徴量 w1,w2,w3 候補 A,B,C 適合度 Db Dc 3 Da 1 入力をAとしたとき,他の候補(B,C)と比べて どれだけ離れているか? 評価関数 未知の入力 item X 特徴量 w1,w2,w4 候補 A,B,C 適合度 Da Dc 3 Db 1 入力をBとしたとき,他の候補(B,C)と比べて どれだけ離れているか?