Index
画像処理 + 機械学習 を用いた物体検出
物体検出の (画像ベースの) 多くの手法では、
- 物体を囲む領域の候補群を推定.
- 得られた物体の領域候補内の画像を「物体認識」に入力して、認識対象物体らしさを計算する.
- 同一物体に複数の BB が検出されないように後処理を行う.
のような手順で処理を行う.
深層学習ベースの手法では、End-to-End で、画像の入力から、物体の検出まで、
一つのニューラルネットワークで処理を行う場合が多い.
線形分類器を用いた物体検出
提案された領域それぞれを物体認識へ入力して、認識対象の物体らしさのスコアを計算するために、
提案された領域の数だけ物体認識の計算を行う必要がある.
1 枚の画像から得られる領域の数は、膨大となる場合があるので、
物体認識の計算コストはできる限り低いことが望ましい.
物体認識は、特徴抽出と分類器の組み合わせで実現できるが、
特徴抽出の方法として HOG 特徴、分類器として線形分類器を利用する場合が多い.
この組み合わせは、低い計算コストで、高い分類精度が出ることが知られている.
HOG 特徴 + SVM
画像特徴量として、HOG 特徴、線形分類器として、線形 SVM を利用した基本的な手法を考える.
Deformable Part Model / DPM
- Deformable Part Modelとその発展