オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】畳み込みニューラルネットワーク #まとめ編

深層学習の「畳み込みニューラルネットワーク」について、書いた記事をまとめた.

Index

基本理論

深層学習のテクニックの中に、画像処理の仕組みを応用した特徴量の抽出手法として 畳み込みニューラルネットワーク / CNN がある.

CNN では、画像処理でも利用されるフィルタリング処理やプーリング処理などを加えており、 その際利用される重みに対して、深層学習の枠組みで最適化を行う.

アルゴリズム

概念編

ネットワークアーキテクチャの改善

LeNet / 1998

CNN の基本的なアイディア.

AlexNet / 2012



ZFNet / 2013

  • Visualizing and Understanding Convolutional Networks

Fourier Convolutional Neural Network / FCNN / 2013 -

3D CNN / 2013

VGG / 2014

GoogleNet / InceptionNet / 2014 -

Inception Module.

  • Going Deeper with Convolutions

InceptionNet v2 / 2015

  • Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

InceptionNet v3 / 2015

InceptionNet v4 / Inception-ResNet / 2016

  • Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

InceptionNeXt / 2023

Fully Convolutional Network / FCN / 2014

Skip Layer Connection / 2015

U-Net / 2015

Feature Pyramid Network / FPN / 2016

Path Aggregation Network / PAN / PANet / 2018

Dilated Convolution / 2015

D3Net / 2020

Dilated Convolution + Dense Net

  • Densely connected multidilated convolutional networks for dense prediction tasks

  • 異なる解像度の特徴をどう結びつけるべきか?:Sonyが提案したD3Net

1D CNN / 2015 -

Darknet / 2016 -

Xception / 2016

MobileNet / 2017

Deformable Convolutional Networks / DCN / 2017 -

OSNet / 2019

ConvNeXt / 2022

ConvNeXt V2 / 2023

  • ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
ConvNeXt に自己教師あり学習の MAE を統合した FCMAE を持つ改良モデル ConvNeXt V2を紹介.

GRNという新しい層により、チャネル間の競合関係を強調する改善を施す.

一定のスケール性を持つ.



RepLKNet / 2022

FlashButterfly / 2023

  • Simple Hardware-Efficient Long Convolutions for Sequence Modeling

Pooling

画像処理タスク

物体認識 / Object Recognition

物体検出 / Object Detection

セグメンテーション / Segmentation

画像生成

他データ分野への応用

動画像処理

参考

  • Papers Explained Review 01: Convolutional Neural Networks

  • ML Papers Explained

  • CS class CS231n: Convolutional Neural Networks for Visual Recognition