Transcript PowerPoint

CRAM: Compact Representation of Action
in Movies
古川拓弥
はじめに
• 著者
– Mikel Rodriguez
– University of Central Florida
• CVPR2010のポスター発表
• 映像の要約(Video Summarizing)
– 特定動作の着目した要約
– フーリエ変換を利用した動作特定
提案手法の流れ
1. 時空間領域中における動的領域の決定
2. 動的領域内からの特定動作の検出
3. エネルギー最小化による映像要約
動的領域の決定(1/3)
• 入力映像からオプティカルフローの算出
• フロー場を周波数領域で考える
– フロー場のフーリエ変換:Clifford Fourier Transform
– 逆フーリエ変換 : Inverse Clifford Fourier Transform
動的領域の決定(2/3)
• 位相情報の逆フーリエ変換により動的領域Wの特定
– フーリエ変換における位相情報とは?
• 2次元画像の場合:画像の濃淡変化が得られる
• フロー場の場合:動きの変化を捉えることが可能
動的領域の推定(3/3)
• 位相情報の逆フーリエ変換により動的領域Wの特定
– しきい値処理によって領域分割 = worm
u:フロー場
P( f(x, y, t) ):位相スペクトル
特定動作の検出
• 動作テンプレートに基づく特定動作の推定
– 入力シーケンスとテンプレートの尤度計算
H(x, y, t):動作テンプレート
s(l+x, m+y, n+t):入力シーケンス
尤度の正規化
• 相関空間の正規化により応答値を最適化
– EH:フィルタエネルギー
– Es(l, m, n):位置 (l, m, n)における評価ボリュームの
エネルギー
エネルギー最小化による映像の要約
• グラフカットを用いてエネルギーを最小化
– データ項 Et:最大時間コスト
• 要約映像の長さ(最大時間)
– 平滑化項 Eo:時間重複コスト
• 特定動作毎の時間的な重複
– ラベル:wormの時間推移
映像要約例
元映像
要約映像
特定動作の要約映像
• 「拾う」動作に着目した映像の要約
– 特定の動作のみを一つのシーンに集約
– 動作検索が容易
映像要約例
• ムービー
– http://vimeo.com/9761199
まとめ
• 特定の動作に着目した映像の要約
– 周波数領域において映像中の動的領域を推定
– テンプレートマッチングにより特定動作を特定
– グラフカットを用いて映像の要約
→ 映像解析の簡略化