オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】物体認識 #まとめ編

Index

物体認識

物体認識とは、入力画像に写る物体を理解し、適切なラベルを付与する過程を指す.

一般的な画像分類 / Classificationという意味も、物体認識とほぼ同義だと思う.

基本的なアルゴリズム



一般的なクラス (物体 / シーン) 認識は、画像特徴抽出分類の 2 つの大きな構造に分けられる.

さらに、画像特徴抽出は、 局所特徴のサンプリング局所特徴の記述統計的特徴抽出コーディングプーリング の処理に分けられる.

  • 画像特徴抽出
    • 局所特徴のサンプリング
    • 局所特徴の記述
    • 統計的特徴抽出
    • コーディング
    • プーリング
  • 分類

画像からの特徴量の抽出の具体的な手法は、以下でまとめる.

分類



入力画像は、特徴抽出の処理を経て、 1 つの特徴ベクトル  x\ \in\ R^{D} となったとする.

物体認識 / 画像分類の最終的な段階として、この特徴ベクトル  x に クラス [tex: { C{k} }^{N{c}}_{k=1}] を付与する分類 / Classification を行う.

特徴空間 / Feature Space

特徴ベクトルで張られる空間を特徴空間 / Feature Space と呼ぶ.

分類では、あらかじめ特徴空間をいくつかの領域に分割し、 各領域にクラス情報を付与する.

入力画像から、得られた特徴ベクトルは、特徴空間上の 1 点として表されるので、 対応するクラスが決まるという仕組みだ.

機械学習

分類の処理に機械学習を用いる手法をまとめる.

ベイズ識別

判別分析

局所学習 / Local Learning

学習システムを入力空間の各局所領域ごとに適合させれば、より適切な予測システムが構築できる.

K 近傍法 / KNN

カーネル密度推定

テンプレートマッチング / Template Matching

KNN では、すべての訓練データを用いて分類を行うが、クラスの代表点のみを用いて 分類を行う手法もある.

深層学習

特徴量の抽出分類の処理に、深層学習を用いる.

参考