Transcript Document

CV Reading
BRISK:Binary Robust Invariant Scalable Keypoints
縣 禎輝
2011/12/13
はじめに
• BRISK
– BRIEFへスケール不変性,回転不変性の導入
• キーポイント検出
– ピラミッド画像からFASTによる特徴点検出
• 特徴記述
– BRIEFの考えにオリエンテーション推定とサンプリングパターン変更
2
キーポイント検出,特徴記述の変遷
3
BRISK:Binary Robust Invariant Scalable
Keypoints[S. Leutenegger,ICCV’11]
• キーポイント検出
– FASTへスケール不変性を導入
• 特徴記述
– 同心円上のサンプリングパターンからランダムな2画素を
選択
– 選択された画素の輝度の大小によるバイナリコード
4
キーポイント検出
• FASTへスケール不変性を導入
– ピラミッド画像からFASTを適応し,レスポンス値より
スケールの算出
5
FASTによるコーナー検出
• 注目画素 p の周辺の円周上の16画素を観測
例 : n = 12
p がコーナーである条件
p の輝度値と比較して円周上の輝度値が連続してn 個以上が
しきい値 t 以上 明るい,もしくは暗い (図中の破線)
6
決定を用いたFASTによるコーナー検出
• 学習画像の画素を特徴ベクトル化
– 注目画素 p 周囲の円周上の輝度値を3値化
注目画素 p の輝度値
円周上の輝度値
しきい値
7
決定を用いたFASTによるコーナー検出
• 決定木の構築
– 特徴ベクトルによる3分木の学習
学習画像
分岐ノード
特徴ベクトルによる分岐
末端ノード
最も到達したクラスを保存
8
決定木によるコーナー検出
• 画像の各画素を入力してコーナー判定
– リーフノードに保存されたクラスに分類
n = 9 のとき,平均して2.16画素の検証でコーナー検出が可能
9
キーポイント検出
:FASTへスケール不変性導入
1. 入力画像からピラミッド画像生成
2. FASTを適応
3. 各特徴点よりレスポンス値Vの算出
V  max(
| I
p x
x:S px brighter
 I p | t ,
| I
p
x:S px  dar ker
 I p x | t )
4. レスポンス値の最大値を
スケールとする
10
スケール検出例
11
特徴記述の流れ
1. 特徴点を中心に4つの同心円上に,等間隔にサンプリング(60箇所)
– 中心からの距離に比例するガウスフィルタによりスムージング
2. サンプリングパターンから
ランダムに2画素を選択
3. オリエンテーションの算出
4. 輝度差によるバイナリコード化
12
BRIEF
• アルゴリズム
1. パッチをガウシアンフィルタにより平滑化
2. パッチ内のランダムに選択された2点の画素値の比較から
バイナリ列を生成
3. 2点のバイナリ列のハミング距離によりマッチング
キーポイント
パッチ
13
BRIEF
• バイナリテスト
キーポイント
パッチ
14
BRIEFの2画素の選択条件
GⅠ
I.
II.
III.
IV.
V.
GⅡ
GⅢ
GⅣ
GⅤ
x, y : 一様分布
x, y : ガウシアン分布
x : ガウシアン分布, y : ガウシアン分布(xiが中心)
x, y : 同心円状のグリッドからランダムに選択
x : 中心点
y : 同心円状のグリッドからバイナリテストの数だけ選択
15
オリエンテーションの算出 及び
バイナリコード化
• 距離が離れたパッチ間の平均勾配をオリエンテーションとする
1. 勾配算出
g
:勾配
I
:輝度値
S:
L:
:選択された2画素
2. 集合 L のみから平均勾配算出
α : オリエンテーション
:ガウスフィルタの分散
3. オリエンテーション方向に回転させた後,
輝度差によりバイナリコード化
バイナリコード数:512ビット
16
マッチング方法
1. 特徴点間のバイナリコードからハミング距離を算出
2. ハミング距離のしきい値判定によりマッチング
17
実験概要
• 使用するデータセット:Mikolajczyk dataset
• 比較手法:SIFT,SURF
18
再現率
19
精度比較
20
処理速度
• 特徴点検出の処理時間
• マッチングの処理時間
21
マッチング結果
22
おわりに
• BRISK
– BRIEFへスケール不変性,回転不変性の導入
• キーポイント検出
– ピラミッド画像からFASTによる特徴点検出
• 特徴記述
– BRIEFの考えにオリエンテーション推定とサンプリングパターン変更
23