- CNN #まとめ編
Index
Feature Pyramid Network / FPN とは
Feature Pyramid Network は、物体検出向けに、
マルチスケールの (大きさの異なる)
画像特徴量の集約を効率的に行うためのネットワークアーキテクチャである.
- 物体検出 #まとめ編
Feature Pyramid (Featurized Image Pyramid) は、物体検出を行うための基本的なテクニックである.
計算量とメモリを消費せずに、Feature Pyramid を CNN の導入する方法を考えたい.
Featurized Image Pyramid
画像処理で利用される考えであり、同じ画像の異なるスケールを入力する仕組みのこと.
- Image Pyramid
CNN の特性
CNN は、より高度な情報を含んだまま、スケール(情報)を小さくしていく手法である.
スケール変化にロバストな特性を持つ
(多少スケールが変わっても同様の特徴量を抽出できる)ため、
すべての入力画像の大きさを単一にできる.
- CNN #概念編
SSD の登場
Single Shot Detector / SSD は、CNN の特徴量 (= Pyramidal Feature Hierarchy) を
Featurized Image Pyramid のように利用最初の試みの一つであった.
Feature Pyramid Network の完成
この論文の目的は、CNN の構造に、途中の特徴量 (=Pyramidal Feature Hierarchy) を
どのように自然に活用しながら、複数のスケールの情報を持つネットワークアーキテクチャを作ることであるのだ.
そこで、Bottom Up (Down Sampling)している途中の特徴量を、
Top Down (Up Sampling) の経路に接続することで、
低解像度で情報の多い特徴量と高解像度で情報の少ない特徴量を統合できるネットワークアーキテクチャが作成できる.
U-Net との類似
似たようなネットワークアーキテクチャに U-Net がある.
違いとしては、U-Net は、単一の情報量の多い特徴マップを予測に使っている.
一方、FPN は、各スケールサイズの情報を、独立して (スケールごとに)、物体検出などの予測を行える.
接続部分
まず、粗い(低い)解像度の特徴マップを入力として、Up Sampling され、サイズが大きくなる.
その出力は、Bottom Up (Down Sampling) している特徴マップとマージされる.
(その前に、 の畳み込み層を経て縮小される.)
ここでの、マージは、要素ごとの加算演算を表す.
応用アルゴリズム
YOLO v3
- [2018]
- yhayato1320.hatenablog.com
Path Aggregation Network / PAN
- [2018]
- yhayato1320.hatenablog.com
EfficientDet
- [2019]
- yhayato1320.hatenablog.com
参考
Feature Pyramid Networks for Object Detection
Pyramid methods in image processing
Web サイト
- Feature Pyramid Networks (FPN) とその発展型