オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】VGG

データサイエンスデータサイエンス-深層学習

yhayato1320.hatenablog.com

VGG とは

畳み込み層とプーリング層から構成される基本的な CNN.

特徴としては、重みのある層 (畳み込み層や全結合層) を
全部で 16 (もしは19) 層まで重ねてディープにしている点.

注目するべき点は、 $3\ \times\ 3$ の小さなフィルターによる畳み込み層を
連続して行っている点.

畳み込み層を 2 ~ 4 回連続し、プーリング層でサイズを半分にするという処理を繰り返して行う.
そして、最後に全結合層を経由して結果を出力する.

以下 VGG-16 のアーキテクチャ詳細.

参考

Very Deep Convolutional Networks for Large-Scale Image Recognition
- [2014]
- arxiv.org

書籍

ゼロから作るDeepLearning
- 8 ディープラーニング
  - 8.2 ディープラーニングの小歴史
    - 8.2.2 VGG
- ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
  - 作者:斎藤康毅
  - オライリージャパン
  Amazon

Web サイト

大規模画像認識のための非常に深い畳み込みネットワーク
- ai-scholar.tech