- YOLO #まとめ編
Index
YOLO v3 とは
YOLO v1 / v2 の改善手法.
- YOLO v2
細かい改善を複数提案している.
また、ネットワークアーキテクチャの改善も行なっている.
改善点
Bounding Box Prediction
BB の位置の予測
YOLO v2 では、Dimension Clusters を利用して、
どのようなサイズの Anchor Box を利用するか決めていた.
さらに、YOLO v2 では、BBの予測を
(BB内の相対座標とサイズを表すパラメータ)を推定し、
BBの座標 をシグモイド関数を使って、以下の方法で計算する.
そして、誤差関数には最小二乗誤差 (SSE / Sum of Squared Error) を利用する.
- 最小二乗誤差 (SSE / Sum of Squared Error)
YOLO v3 では、推定値 から誤差を算出する.
そのため、誤差関数とその勾配は以下のようになる.
(勾配)
(Ground Truth - 予測)
BB の物体確信度スコアの予測
YOLO v3 では、物体があるかどうかの確信度を ロジスティック回帰で予測する.
誤差に適用する Anchor
すべての Anchor と GT の誤差を学習に適用するのではなく、 最もIoUが高い Anchor 誤差のみを学習する.
マルチラベル対応
分類のための活性化関数に Softmax を使わず、ロジスティック関数を利用することで、
マルチラベルの予測に対応.
誤差関数には、バイナリ交差エントロピーを利用した.
複数スケールでの予測
YOLO v3 では、3 つの異なるスケールで BB を予測する.
Feature Pyramid Network と同様の概念を導入する.
- Feature Pyramid Network
つまり、Down Sampling 中の特徴を、Up Sampling 中の特徴と連結させる.
Feature Extractor / Backbone
YOLO v2 では、ネットワークアーキテクチャに Darknet-19 を導入していた.
- Darknet-19
YOLO v3 では、Darknet-19 に Residual Network を加えて、
さらに深くした Darknet-53 を導入する.
- Darknet-53
参考
- YOLOv3: An Incremental Improvement
- [2018]
- Abstract
- 1 Introduction
- 2 The Deal
- 2.1 Bounding Box Prediction
- 2.2 Class Prediction
- 2.3 Predictions Across Scales
- 2.4. Feature Extractor
- arxiv.org
Web サイト
A Closer Look at YOLOv3
YOLOv3:精度は本当に良くなったのか?論文から読み解く改善の要点
What’s new in YOLO v3?