オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】分野一覧 #まとめ編

データサイエンスデータサイエンス-深層学習

#まとめ編一覧
- yhayato1320.hatenablog.com

Index

Index
基本アーキテクチャ
- ニューラルネットワーク / Neural Network / NN
- Deep Neural Network / DNN
応用アーキテクチャ
工夫・テクニック
応用的な研究
モデル形式
- Auto Regression Model / 自己回帰モデル
- Generative Model / 生成モデル
  - GAN
タスク
データ分野
サービス
参考
- 書籍
- Web サイト
  - 動画

基本アーキテクチャ

ニューラルネットワーク / Neural Network / NN

事前に基底関数の数を固定し、データに適応させるアルゴリズム.

つまり、基底関数に対して、パラメトリック形を用いて、そのパラメータを訓練中に適応させるアルゴリズム.

似たようなアルゴリズムとして、パーセプトロンがある.

パーセプトロン
- yhayato1320.hatenablog.com

ニューラルネットワークを (パーセプトロンを、1 層のニューラルネットとして)、多層パーセプトロン (MLP) と考える場合もあるが、非連続な非線形性を持つ MLP と比べ、NN は連続的な非線形性を持つ.

パーセプトロンとは、活性化関数が異なる.

(パーセプトロンでは、ステップ関数を利用している)

パーセプトロンとニューラルネットワークの違い

kakts-tec.hatenablog.com

Deep Neural Network / DNN

ニューラルネットワークを深く、多層化したネットワークを Deep Neural Network / DNN と呼んでいる.

Deep Neural Network / DNN
- yhayato1320.hatenablog.com

そして、Deep Neural Network / DNN を利用した学習を深層学習 / DeepLearning とよぶ.

Deep Neural Network には、いくつかのネットワークアーキテクチャがあり、単純な基本的なネットワークとして、順伝播ネットワーク / フィードフォワードネットワークがある.

フィードフォワードネットワーク / Feed Forward Network / FFN
- yhayato1320.hatenablog.com

応用アーキテクチャ

Skip Layer Connection

Skip Layer Connection を追加したネットワークアーキテクチャ.

Skip Layer Connection
- yhayato1320.hatenablog.com

CNN

Convolutional Neural Network / CNN
- FNN に畳み込み演算を加えた
- yhayato1320.hatenablog.com

RNN

Recurrent Neural Network / RNN
- FNN に再帰的な仕組みを追加
- yhayato1320.hatenablog.com

Attention

Attention
- yhayato1320.hatenablog.com

Transformer

Transformer
- yhayato1320.hatenablog.com

BERT

BERT
- yhayato1320.hatenablog.com

GPT

GPT
- yhayato1320.hatenablog.com

GNN

GNN
- yhayato1320.hatenablog.com

TabNet

TabNet
- yhayato1320.hatenablog.com

DualNet / 2017

DualNet: Learn Complementary Features for Image Recognition
- [2017]
- http://home.ustc.edu.cn/~saihui/project/dualnet/iccv17_dualnet.pdf

KAN

A Simplified Explanation Of The New Kolmogorov-Arnold Network (KAN) from MIT
- medium.com

Epistemic Neural Networks / ENN

Epistemic Neural Networks
- [2021]
- arxiv.org

Bayesian Neural Networks / BNN

Bayesian Neural Networks: An Introduction and Survey
- [2020]
- arxiv.org

Spiking Neural Network / SNN

Spiking Neural Network
- yhayato1320.hatenablog.com

工夫・テクニック

Zero / One / Few Shot Learning

Zero / One / Few Shot Learning
- yhayato1320.hatenablog.com

活性化関数 / Activation Function

活性化関数 / Activation Function
- yhayato1320.hatenablog.com

正規化 / Normalization

Normalization
- yhayato1320.hatenablog.com

Neural Architecture Search / NAS

Neural Architecture Search / NAS
- yhayato1320.hatenablog.com

Pre Training / 事前学習

Pre Training / Fine Turning
- yhayato1320.hatenablog.com

基盤モデル / Foundation Model

基盤モデル / Foundation Model
- yhayato1320.hatenablog.com

Weight Initialization

Weight Initialization
- yhayato1320.hatenablog.com

表現学習 / Representation Learning

表現学習 / Representation Learning
- yhayato1320.hatenablog.com

誤差関数 / Loss Function

誤差関数 / Loss Function
- yhayato1320.hatenablog.com

正則化 / Regularization

正則化 / Regularization
- yhayato1320.hatenablog.com

Metric Learning / Distance Learning

Metric Learning / Distance Learning
- Deep Metric Learning
- yhayato1320.hatenablog.com

勾配の計算 / Gradient

どのように勾配を計算するか.

誤差逆伝播法 / Error Backpropagation

Forward Gradient / 2022

Gradients without Backpropagation
- [2022]
- arxiv.org

Forward-Forward / 2022

The Forward-Forward Algorithm: Some Preliminary Investigations
- [2022]
- https://www.cs.toronto.edu/~hinton/FFA13.pdf
https://neurips.cc/virtual/2022/invited-talk/55869
- keras での実装について

最適化 / Optimization

勾配情報をどのように利用するか.

Optimization
- yhayato1320.hatenablog.com

Neural Functional Networks / NFN / 2023

Permutation Equivariant Neural Functionals
- [2023]
- arxiv.org
- github.com

応用的な研究

Meta Learning

Meta Learning
- yhayato1320.hatenablog.com

Knowledge Distillation

Data Distillation

Data Distillation
- yhayato1320.hatenablog.com

Model Compression / モデルの圧縮・軽量化

Model Compression
- yhayato1320.hatenablog.com

Data Pruning

Data Pruning
- yhayato1320.hatenablog.com

Grokking

Grokking
- yhayato1320.hatenablog.com

Scaling Law / スケーリング則

Scaling Law / スケーリング則
- yhayato1320.hatenablog.com

平坦解 / Flat Minima

平坦解 / Flat Minima
- yhayato1320.hatenablog.com

モデルへの攻撃 / Attack

攻撃 / Attack
- yhayato1320.hatenablog.com

モデルの性能評価

モデルの性能評価
- yhayato1320.hatenablog.com

モデルの編集

モデルの編集
- yhayato1320.hatenablog.com

Neural Field

Neural Field
- yhayato1320.hatenablog.com

Transfer Learning / 転移学習

Transfer Learning / 転移学習
- yhayato1320.hatenablog.com

Small Data

Small Data
- yhayato1320.hatenablog.com

Calibration

Expectation Consistency / EC / 2023

Expectation consistency for calibration of neural networks
- [2023]
- arxiv.org

Probabilistic Embedding

データを「点」ではなく「確率分布」として埋め込む「確率埋め込み」.

Probabilistic Embeddings Revisited
- [2022]
- arxiv.org

世界モデル

ChatGPTの中の"世界モデル"
- note.com

モデル形式

深層学習のアルゴリズムにおける分類について.

Auto Regression Model / 自己回帰モデル

Auto Regression Model / 自己回帰モデル
- yhayato1320.hatenablog.com

Generative Model / 生成モデル

Generative Model / 生成モデル
- yhayato1320.hatenablog.com

GAN

GAN
- yhayato1320.hatenablog.com

タスク

タスク一覧 #まとめ編
- yhayato1320.hatenablog.com

データ分野

自然言語処理

自然言語処理
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com

音声解析

音声解析
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com

時系列解析

時系列解析
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com

画像処理

画像処理
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com

テーブルデータ解析

テーブルデータ解析
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com

サービス

github.com
- AI を利用したサービスのまとめ

参考

On generalization bounds for deep networks based on loss surface implicit regularization
- [2022]
- arxiv.org
  - 深層学習が過学習を起こさない原理を、ニューラルネットワークがエネルギー曲面上で滞留する数学的理論を開発して説明した
  - 深層学習が大自由度にも関わらず過学習しない原理は長年の未解明点であり、これを説明する理論を開発した
  - 深層学習を効率的に制御するための理論の発展や、アルゴリズム開発・ネットワーク設計などへの工学的応用が期待される
  - www.u-tokyo.ac.jp
Modular Deep Learning
- [2023]
- arxiv.org
The Little Book of Deep Learning
- https://fleuret.org/public/lbdl.pdf

書籍

パターン認識と機械学習上
- 5 ニューラルネットワーク
  - 5.1 フィードフォワードネットワーク
- パターン認識と機械学習上
  - 作者:C.M. ビショップ
  - 丸善出版
  Amazon
Python 機械学習プログラミング
- 12 ニューラルネットワーク画像認識トレーニング
- [asin:B01HGIPIAK:detail]
ゼロから作る Deep Learning
- 3 ニューラルネットワーク
  - 3.1 パーセプトロンからニューラルネットワークへ
  - 3.2 活性化関数
- 4 ニューラルネットワークの学習
- 8 ディープラーニング
- ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
  - 作者:斎藤康毅
  - オライリージャパン
  Amazon
これならわかる深層学習入門
- 機械学習スタートアップシリーズこれならわかる深層学習入門
  - 作者:瀧雅人
  - 講談社
  Amazon

Web サイト

Deep Learning: A Survey of Surveys
- qiita.com
ニューラルネットワーク / wikipedia
- ja.wikipedia.org
Understanding Deep Learning
- https://udlbook.github.io/udlbook/
高速な深層学習モデルアーキテクチャ2023
- speakerdeck.com
深層学習の数理
- https://ibis.t.u-tokyo.ac.jp/suzuki/lecture/2023/TohokuUniv/%E6%9D%B1%E5%8C%97%E5%A4%A7%E5%AD%A62023.pdf
数学者が書いた深層学習講義
- note.com

動画

MIT Introduction to Deep Learning | 6.S191
- www.youtube.com
MITの深層学習の動画リスト
- www.youtube.com