各次元MKL + 背景除去 - CS17 Ariki Laboratory, Kobe University

Download Report

Transcript 各次元MKL + 背景除去 - CS17 Ariki Laboratory, Kobe University

MIRU 2010
物体領域特徴の自動選定とマルチカーネル学習を用いた
特徴統合による一般物体認識
神戸大学大学院 工学研究科 情報知能学専攻
◎中鹿 亘, 須賀 晃, 滝口 哲也, 有木 康雄
CS17 Media Laboratory, Kobe University
研究背景

自動での画像分類・検索技術の期待



WWW上の画像の爆発的な増大
ハードディスクの大容量化
計算機と人間のセマンティックギャップの解消

計算機は人間のような画像中の一般物体の認識が困難
計算機の一般物体認識
猫?
能力向上が必要
CS17 Media Laboratory, Kobe University
研究内容

一般物体認識


Bag-of-Features(局所特徴ヒストグラム)を用いた手法が主流
近年では,特徴統合による手法が注目を集めている
方向
色
形状
局所
周期

従来研究における問題点


背景ノイズの影響 ⇒ 重みそのものに誤りが生じる
特徴量単位の重み学習 ⇒ 次元ごとの識別性を考慮できない
CS17 Media Laboratory, Kobe University
提案手法
①
最適な重み学習のための自動背景除去
Saliency
Map
視覚注意領域画像
入力画像
②
特
徴
抽
出
Graph
Cuts
出力画像
次元ごとのMultiple Kernel Learningによる重み学習
形状
局所
色
より“正確”で“詳細”な重み付け統合
CS17 Media Laboratory, Kobe University
提案システム
入力
画像
注目領域
検出
Saliency Map
セグメン
テーション
Graph Cuts
学習
画像
特徴抽出
BoF
Color
Gabor
識別
特徴統合
MKL
SVM
結果
出力
+
境界学習
SVM
背景除去
CS17 Media Laboratory, Kobe University
背景除去 : Saliency Map + Graph Cuts

Saliency MapとGraph Cutsを組み合わせることで,画像中の注目領域の自動セ
グメンテーションを行う
Saliency Map
・・・顕著性のある領域(視覚注意を引く領域)を抽出
・・・画像セグメンテーション
Object terminal
Graph Cuts
min cut
色特徴(RGB) : Cp
S
GMM
物体コスト(t-link)
 ln Pr( B | C p )
近傍類似コスト(n-link)
B{ p , q }
背景コスト(t-link)
 ln Pr( O | C p )
スケールサイズを変え
ながらラスタスキャン
色特徴(RGB) : Cp
GMM
T
Background terminal
注目領域抽出
画像セグメンテーション
CS17 Media Laboratory, Kobe University
背景除去 : Saliency Map + Graph Cuts

概要: Saliency MapをSeedsとした多重解像度解析によるGraph Cuts
視覚注意領域抽出
Saliency Map
seeds
入力
多重解像度解析
LL,HL
LH,HH
LL: 平滑化画像
n-link
bkg
Graph Cuts
Segmentation
再学習
t-link
HL,LH,HH:
局所テクスチャ
出力
事前確率
GMM(色+テクスチャ)更新
t ← t-1
解像度レベルの更新
CS17 Media Laboratory, Kobe University
提案システム
入力
画像
注目領域
検出
Saliency Map
セグメン
テーション
Graph Cuts
学習
画像
特徴抽出
BoF
Color
Gabor
識別
特徴統合
MKL
SVM
結果
出力
+
境界学習
SVM
背景除去
CS17 Media Laboratory, Kobe University
特徴抽出

Bag-of-Features (局所輝度勾配特徴)
DoG
Grid
[次元数]=visual word数=1000次元

Color Features (色特徴)
[次元数]=64次元×9ブロック=576次元

Gabor Features (濃淡周期・方向特徴)
[次元数]=6方向×4周期×9ブロック=216次元
CS17 Media Laboratory, Kobe University
提案システム
入力
画像
注目領域
検出
Saliency Map
セグメン
テーション
Graph Cuts
学習
画像
特徴抽出
BoF
Color
Gabor
識別
特徴統合
MKL
SVM
結果
出力
+
境界学習
SVM
背景除去
CS17 Media Laboratory, Kobe University
特徴統合

Multiple Kernel Learningによる特徴統合



複数のサブカーネルを線形統合し,新たなカーネルを求める手法
カーネルの線形統合を画像特徴の統合として用いる
各次元ごとにカーネルを用意し,最適なカーネル重みを求める
k ( x , xi )
 1 k1 ( x , x i )   2 k 2 ( x , x i )     K k K ( x , x i )
 ( x ),  ( x i )
CS17 Media Laboratory, Kobe University
特徴統合

Single Kernel Learning
f ( x)  w,  ( x)  b
n
f ( x) 
  i yi
 ( x ),  ( x i )  b
i 1
K ( x , xi )

Multiple Kernel Learning
K
f ( x) 

k 1
K
f ( x) 
wk ,  k ( x )  b
n
  k   i yi
k 1
 k ( x ),  k ( x i )  b
i 1
K k ( x , xi )
CS17 Media Laboratory, Kobe University
特徴統合 : Multiple Kernel Learning

MKL-SVM 主問題
Min-Max問題

MKL-SVM 双対問題
1. βkを均等重みに初期化
2. βkを固定し,統合カーネルを単一カーネ
ルとしてSVM学習を行いαiを求める
K
3. αiを固定し, k 1  k S k ( ) が増加するよう
にβkを求める
CS17 Media Laboratory, Kobe University
提案システム
入力
画像
注目領域
検出
Saliency Map
セグメン
テーション
Graph Cuts
学習
画像
特徴抽出
BoF
Color
Gabor
識別
特徴統合
MKL
SVM
結果
出力
+
境界学習
SVM
背景除去
CS17 Media Laboratory, Kobe University
物体クラスの識別

Support Vector Machine (SVM) による識別

One-Versus-Rest法
あるクラスを正,それ以外のクラスを負として2クラスの識別器を作成
 各物体クラスについて学習


テストデータの分類
全識別器にテストデータを入力
 スコアの最も高いクラスを識別結果として出力

CS17 Media Laboratory, Kobe University
予備実験: セグメンテーション精度評価

使用データベース: GrabCut Segmentation Database

画像枚数: 50枚

評価方法: 誤検出率




Over segmentation rate = 物体領域の誤検出ピクセル数/全ピクセル数
Under segmentation rate = 背景領域の誤検出ピクセル数/全ピクセル数
Error rate = (Over segmentation + Under segmentation)
実験内容:


Saliency MapをSeedsとした多重解像度解析による繰り返しGraph Cuts
セグメンテーション比較実験:


Saliency Cut [Yu Fu, Jian Cheng, Zhenglong Li, Hanqing Lu, 2008]
Saliency Map + 多重解像度解析Graph Cuts
従来手法
提案手法
http://research.microsoft.com/en-us/um/cambridge/projects/visionimagevideoediting/segmentation/grabcut.htm
CS17 Media Laboratory, Kobe University
実験結果1

多重解像度レベルによるエラー率の推移
LV.1
LV.2
LV.3
LV.4
LV.5
LV.6
OSR
10.78%
6.04%
4.37%
4.35%
4.31%
4.31%
USR
14.47%
9.27%
6.47%
6.71%
6.64%
6.77%
ERR
25.25%
15.31%
10.84%
11.06%
10.95%
11.08%
セグメンテーション結果
OSR ・・・ 物体領域の誤検出率
USR ・・・ 背景領域の誤検出率
ERR ・・・ 全体の誤検出率
入力画像
正解マスク
CS17 Media Laboratory, Kobe University
実験結果2

従来手法と提案手法のエラー率の比較
CS17 Media Laboratory, Kobe University
実験結果3

繰り返しセグメンテーションの例
CS17 Media Laboratory, Kobe University
評価実験: 分類精度評価

使用データベース: Caltech101

物体クラス数: 101種類

学習データ: 30枚/クラス

使用特徴量: BoF(DoG), BoF(Grid), Color, Gabor

識別器: MKL-SVM

評価方法: 平均分類率 (Confusion Matrix)

実験内容:




通常のMKL
通常のMKL + 背景除去
各次元ごとのMKL
各次元ごとのMKL + 背景除去
従来手法
提案手法
Caltech101:http://www.vision.caltech.edu/Image_Datasets/Caltech101/Caltech101.html Fei-Fei et al. (2004)
CS17 Media Laboratory, Kobe University
実験結果1
学習枚数
(a)
MKL
(b)
各次元MKL
(c)
MKL+背景除去
(d)
各次元MKL+背景除去
10枚
59.1%
61.6%
61.9%
64.2%
20枚
66.2%
67.9%
68.4%
72.3%
30枚
68.7%
69.9%
72.5%
76.4%
背景除去の効果
各次元の効果
80
76.4
72.3
平均分類率(%)
75
70
65
60
相乗効果
59.1
61.6 61.9
64.2
66.2
67.9 68.4
68.7 69.9
72.5
55
50
45
40
a
b
c
学習10枚
d
a
b
c
学習20枚
d
a
b
c
d
学習30枚
CS17 Media Laboratory, Kobe University
実験結果2
 Confusion Matrix
横軸 – テストデータ
縦軸 – 分類されたクラス
各次元MKL + 背景除去
平均分類率: 76.4%
CS17 Media Laboratory, Kobe University
結論

まとめ




Saliency MapをSeedsとしたGraph Cutsによる自動背景除去手法
を提案し,特徴統合の重みの精度が向上した
各次元のMultiple Kernel Learningによる詳細な特徴統合手法を
提案
背景除去と併せて,相乗的な識別性能の向上を確認
今後の課題


セグメンテーション精度,識別精度の向上
複数物体のセグメンテーション・識別への応用
CS17 Media Laboratory, Kobe University
ご清聴ありがとうございました
CS17 Media Laboratory, Kobe University
発表論文

全国大会





国際会議


須賀晃,福田恵太,滝口哲也,有木康雄: “SIFTとGraph Cutsを用いた物体認識及びセグメン
テーション”, 電子情報通信学会総合大会,IEICE2008,D-12-122,p.253,2008-03
須賀晃,福田恵太,滝口哲也,有木康雄: “SIFTとGraph Cuts を用いた物体認識及びセグメン
テーション”, 情報処理学会平成20年度関西支部大会,C2-08,pp.181-182,2008-10 (学生賞受
賞)
須賀晃, 滝口哲也, 有木康雄: “複数特徴量の重み付け統合による一般物体認識”,
電子情報通信学会総合大会,IEICE2009,D-12-76,p.185,2009-03
須賀晃, 滝口哲也, 有木康雄: “複数特徴量の重み付け統合による一般物体認識”,情報処理学
会平成21年度関西支部大会,C-03,CD-ROM,2009-09
Akira Suga, Keita Fukuda, Tetsuya Takiguchi, Yasuo Ariki:
“Object Recognition and Segmentation Using SIFT and Graph Cuts”,
Proc. of 19th Int'l Conf. on Pattern recognition (ICPR08), CD-ROM, 2008-12
研究報告


須賀晃, 福田恵太, 滝口哲也, 有木康雄: “SIFTとGraph Cuts を用いた物体認識及びセグメン
テーション”, 画像の認識・理解シンポジウム, MIRU2008, IS2-3, pp.611-616, 2008-07
須賀晃,滝口哲也,有木康雄: “複数特徴量の重み付け統合による一般物体認識”,画像の認
識・理解シンポジウム, MIRU2009, IS1-29, pp.589-594, 2009-07
CS17 Media Laboratory, Kobe University
CS17 Media Laboratory, Kobe University
以下,質問用スライド
CS17 Media Laboratory, Kobe University
背景除去

Saliency Map
CS17 Media Laboratory, Kobe University
Graph Cuts Segmentation
1. グラフの作成
n-link
・・・境界情報
近傍画素との類似度を表し,類似している
程高いコスト値を持つ
t-link
・・・領域情報
物体と背景の色ヒストグラムを混合ガウス
分布モデルに適用.物体または背景に近い
程高いコスト値を持つ
2. セグメンテーション
与えられたコストを用いて,min cut/max
flowアルゴリズムによって画像のセグメン
テーションを行う
CS17 Media Laboratory, Kobe University
繰り返し処理
Pr(Yp|B)
物体コスト
Color (RGB) :Cp
GMM
Local texture:Tp
-ln Pr(B|Yp)
S:”obj”
距離変換
背景
Pr(B)
p
Pr(Yp|O)
Color (RGB) :Cp
Local texture:Tp
GMM
-ln Pr(O|Yp)
距離変換
物体
T:”bkg”
背景コスト
Pr(O)
CS17 Media Laboratory, Kobe University
Kernel Learning

Single Kernel Learning

Multiple Kernel Learning
CS17 Media Laboratory, Kobe University
特徴統合

Semi-Infinite Linear Program (SILP)
CS17 Media Laboratory, Kobe University
実験結果X
CS17 Media Laboratory, Kobe University
実験結果X

失敗例

原因

誤検出領域を再学習したことによって,誤検出領域が拡大したため
CS17 Media Laboratory, Kobe University
実験結果X

単体特徴量による分類結果
特徴量
平均分類率
Bag-of-Features(DoG)
47.3%
Bag-of-Features(Grid)
51.2%
Color Features
38.5%
Gabor Features
40.5%
Multiple Kernel Learning
68.7%
提案手法
76.4%
学習画像枚数: 30枚
CS17 Media Laboratory, Kobe University
実験結果X

学習枚数による分類率の変化
90
80
76.4
72.3
68.7
66.2
70
59.1
60
50
64.2
46.747.3
44.1
51.2
48.6
45.3
40
36.938.5
33.3
3940.5
34.9
Color
Gabor
10
20
30
30
20
10
0
BoF-DoG
BoF-Grid
MKL
提案手法
CS17 Media Laboratory, Kobe University
実験結果X

Recall BEST 5 and WORST 5
BEST 5
Class
Recall
WORST 5
Class
Recall
1
Pagoda
1.000
1
Anchor
0.194
1
Sunflower
1.000
1
Cup
0.194
1
Inline skate
1.000
3
Cannon
0.226
4
Leopards
0.968
4
Okapi
0.258
4
Laptop
0.968
5
Stapler
0.290
CS17 Media Laboratory, Kobe University
実験結果X

Precision BEST 5 and WORST 5
BEST 5
Class
Precision
WORST 5
Class
Precision
1
Grand piano
0.945
1
Anchor
0.129
2
Inline skate
0.934
2
Cannon
0.132
2
Mandolin
0.934
3
Camera
0.209
4
Chandelier
0.933
4
Cougar body
0.210
5
Mayfly
0.924
5
Cup
0.223
CS17 Media Laboratory, Kobe University
実験結果X

F-value BEST 5 and WORST 5
BEST 5
Class
F-value
WORST 5
Class
F-value
1
Inline skate
0.9659
1
Anchor
0.1598
2
Mayfly
0.9512
2
Cannon
0.1728
3
Beaver
0.9417
3
Cup
0.2163
4
Windsor chair
0.9411
4
Okapi
0.2614
5
Mandolin
0.9345
5
Camera
0.2745
CS17 Media Laboratory, Kobe University
実験結果X

F値ワースト3クラスの学習画像例
CS17 Media Laboratory, Kobe University
実験結果X

繰り返しGraph Cutsの例 (Caltech 101 Datebase)
入力画像
Saliency Seed
GC(1)
GC(2)
GC(3)
CS17 Media Laboratory, Kobe University