Index
Scaled-YOLO v4 とは
YOLO v4のネットワークであるCSP Darknet-53をベースに、
解像度、幅、深さのパラメータ空間を探索することで、改善した手法.
EfficietntDet-D7を超える精度と速度を達成.
改善の流れ
- YOLO v4 のネットワークアーキテクチャを再設計して、YOLO v4-CSP を提案
- YOLO v4-CSP をベースに Scaled-YOLO v4 を作成
改善点
- 計算コストとメモリ使用を抑えたモデルスケーリング
- 大きな物体の対応
- スケーリング係数の関係を考慮したモデルスケーリング
モデルスケーリング
一般的なモデルスケーリング
CNN アーキテクチャの以下の変数に対し、効率のよいパラメータを探索する.
- 画像サイズ (解像度)
- レイヤー数 (深さ)
- チャネル数 (幅)
ベースのCNNのアーキテクチャは、以下を想定.
ResNet
ResNext
DarkNet
モデルの縮小化
計算リソースが少ないデバイスでの実行を想定して、ネットワークアーキテクチャを考える.
モデルの拡大化
GPU などを利用できる環境での実行を想定して、ネットワークアーキテクチャを考える.
YOLOv4-CSP
Backbone
CSP Darknet-53 を基に、Residual Layer を追加して改善する.
参考
- Scaled-YOLOv4: Scaling Cross Stage Partial Network
- [2020]
- Abstract
- 1 Introduction
- 3 Principles of model scaling
- 3.1 General principle of model scaling
- 3.2 Scaling Tiny Models for Low-End Devices
- 3.3 Scaling Large Models for High-End GPUs
- 4 Scaled-YOLOv4
- 4.1 CSP-ized YOLOv4
- arxiv.org
Web サイト
- Scaled YOLO v4 is the best neural network for object detection on MS COCO dataset