オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】記述子 / Descriptor

Index

記述子 / Descriptor とは

局所領域の内容を認識に有利な情報に変換する過程を記述 / Description といい、 記述された情報を記述子 / Descriptor という.

一般的にベクトル  v\ \in R^{D} として表現される.

局所領域の記述子は、局所記述子 / Local Descriptor と呼ぶ.

認識に有利な情報を得るために、局所領域の形やテクスチャ情報などを抽出する.

様々な記述子

画素記述子 / Raw Pixel Descriptor

画素記述子 / Raw Pixel Descriptor は最も単純な局所記述子で、 局所領域の情報をそのままベクトル化したもの.

画像  I の局所領域中に  N 個の画素  { I(x_{n}) }_{n=1}^{N} があるとする.

局所領域内のすべての画素値を結合したベクトルが画素記述子である.



したがって、画素記述子は、

 v\ =\ ( I(x_{1}),\ \cdots,\ I(x_{n}))^{T}



と表せる.



例えば、RGB で表現された画像であれば、 画素は RGB の 3 次元ベクトル  I (x_n) \in R^{3}となる.

このように画素が多次元のベクトルで表現されている場合も、 下のように各画素の値を結合して画素記述子を構成する.

 v\ =\ ( I(x_{1})^{T},\ \cdots,\ I(x_{n})^{T})^{T}

局所バイナリパターン / Local Binary Pattern / LBP

局所バイナリパターン / Local Binary Pattern / LBP は、局所領域のテクスチャ情報を表現する記述子.

局所輝度勾配

輝度勾配は、エッジを検出する効果があるので、 局所輝度勾配ヒストグラム形の情報を表現しているといえる.

また、輝度勾配の方向が量子化されるために、微小な回転に対して頑健な表現となる.

さらに、小領域内の輝度勾配ヒストグラムを計算するために、移動に対する若干の不変性を持つ.

バイナリ局所記述子 / Binary Local Descriptor

たった 1 枚の画像から大量の局所特徴が得られるうえに、 計算する対象となる画像は、時間とともに増えていく場合もある.

また、計算リソースが限られるモバイルデバイスなどの環境における 局所特徴抽出を考えると、 特徴量抽出時間や特徴量どうしの類似度計算が高速であり、 かつ省メモリ化が望ましい.

このような要件に合致する記述子として、バイナリ局所記述子 / Binary Local Descriptor が利用される.

高次局所自己相関特徴 / Higher-order Local Auto-Correlation / HLAC

画像中の物体の位置によらず、同じ物体が写っていれば、同じ表現となることを 位置不変性という.

位置不変性は様々な幾何学不変性の中でも基本的なものであり、 特徴抽出手法が位置不変性をもてば、認識にに有利にはたらく.

位置不変な特徴として、自己相関関数がある.

GIST 記述子 / GIST Descriptor

GIST 記述子 / GIST Descriptor は、シーンを記述する低次元の大域特徴として考えれた.

GIST 記述子は、画像にガボールフィルター / Gabor Filter を適用することで得られる.

CNN Descriptor

訓練データを用いて学習された CNN (畳み込みニューラルネットワーク / Convolutional Neural Network) を用いて特徴量記述子を得ることができる.

参考