オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】テンプレートマッチング / Template Matching #アルゴリズム編

Index

テンプレートマッチング / Template Matching

入力の画像データ(もしくは、その特徴量ベクトル)と、 テンプレート画像(複数でも)と、画像空間 (もしくは、特徴空間)における距離 (場合によっては誤差と解釈) を計算する.

その距離を元に類似度として測定したり、分類・検出のタスクに持ってくことができる.

物体認識 / 画像分類での利用

物体認識 / 画像分類での利用を考える.

KNN のように、分類対象の画像の特徴量ベクトルが、特徴空間において、 どのようなクラスの特徴量と位置しているかを考える.

KNN とは、異なりクラスの代表点のみとの距離を利用する.

物体検出での利用

スライディングウィンドウと併用で利用する.

距離 / 誤差の計算

入力画像の特徴ベクトルを  x\ \in R^{D} とする.

また、2 次元の (もしくは 3 次元) 入力画像をそのまま、計算に使用することも可能で、その場合は以下のように変換されていると考えればよい.

 I(a, b)\ =\ x_{i}



また、テンプレート画像の特徴ベクトルを  y \ \in\ R^{D} とする.

今回は距離 / 誤差を算出する関数は、 F で表す.

ユークリッド距離 / Euclid Distance

一般的に利用される距離.

 F_{Euclid}\ =\ \sqrt{ \displaystyle \sum_{i}^{D} (x_{i}\ -\ y_{i})^{2} }



SSD / Sum of Squared Difference

二乗和誤差 / Sum of Squared Error / SSE や 残差平方和 / Residual Sum of Square / RSS と同義.

ユークリッド距離の二乗の値.

 F_{SSD}\ =\ \displaystyle \sum_{i}^{D} (x_{i}\ -\ y_{i})^{2}



SAD / Sum of Absolute Difference

差分の絶対値の合計.

 F_{SAD}\ =\ \displaystyle \sum_{i}^{D} | x_{i}\ -\ y_{i} |

NCC / Normalized Cross Correlation

正規化相互相関.

統計量でいう相関係数に近い.

 F_{NCC}\ =\ \displaystyle \frac{ \displaystyle \sum_{i}^{D} x_{i}\ \cdot\ y_{i}}
{\sqrt{\displaystyle \sum_{i}^{D} x_{i}^{2}}\ \sqrt{\displaystyle \sum_{i}^{D} x_{y}^{2}}}



参考