VGG とは
畳み込み層とプーリング層から構成される基本的な CNN.
特徴としては、重みのある層 (畳み込み層や全結合層) を
全部で 16 (もしは19) 層まで重ねてディープにしている点.
注目するべき点は、 の小さなフィルターによる畳み込み層を
連続して行っている点.
畳み込み層を 2 ~ 4 回連続し、プーリング層でサイズを半分にするという処理を繰り返して行う.
そして、最後に全結合層を経由して結果を出力する.
以下 VGG-16 のアーキテクチャ詳細.
参考
- Very Deep Convolutional Networks for Large-Scale Image Recognition
- [2014]
- arxiv.org
書籍
Web サイト
- 大規模画像認識のための非常に深い畳み込みネットワーク