オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【動画像処理】MOSSE Tracking

Index

MOSSE Tracking とは

最小出力二乗和誤差(MOSSE)を利用した correlation filter (相関フィルター).

様々な Correlation Filter

  • Synthetic Discriminant Functions
  • Minimum Variance Synthetic Discrimi- nant Functions (MVSDF)
  • Minimum Average Cor- relation Energy (MACE)
  • Optimal Tradeoff Filters (OTF)
  • Minimum Squared Error Synthetic Dis- criminant Functions (MSESDF)

Correlation Filter Tracking

最初のフレームでターゲットとなる物体が検出されていることを前提とする.

このターゲットが次のフレームのどこにあるかを考えたい.

そこで、Search Window (2次元の長方形の領域) を次のフレーム内で動かし、 Search Window の領域内の画像とターゲットの画像の類似度 (相関) を計算し、 最も高い相関を出した Search Window の領域が、前フレームでターゲットとしていた物体が写っている可能性が高い.

入力画像  f、フィルター  hフーリエ変換 (Fast Fourier Transform; FFT) する.

 F = FFT(f)
 H = FFT(h)



そのとき、相関  G は以下のように計算できる.

 G = F \odot H^{*}


 \odot は要素ごとの積.  H^{*} H複素共役.

相関の出力は、逆FFTを使用して空間ドメインに変換される

このアルゴリズムの弱点は、通常の FFT と逆 FFT の 2 つを利用することによる処理時間コストである.

アルゴリズム

MOSSEは、より少ない学習画像からASEFのようなフィルターを生成するためのアルゴリズム.

学習を行うには、入力  f_i と、出力  g_i のペアが必要.

 g_i は任意の形状のグラウンドトゥルースでよい.

学習は、入力と出力の間の単純な要素ごとの関係を利用するために、フーリエ領域で実行される.

参考