- #まとめ編 一覧
Index
- Index
- 基本アーキテクチャ
- 応用アーキテクチャ
- 工夫・テクニック
- Zero / One / Few Shot Learning
- 活性化関数 / Activation Function
- 正規化 / Normalization
- Neural Architecture Search / NAS
- Pre Training / 事前学習
- Weight Initialization
- 表現学習 / Representation Learning
- 誤差関数 / Loss Function
- 正則化 / Regularization
- Metric Learning / Distance Learning
- 勾配の計算 / Gradient
- 最適化 / Optimization
- Neural Functional Networks / NFN / 2023
- 応用的な研究
- モデル形式
- タスク
- データ分野
- サービス
- 参考
基本アーキテクチャ
ニューラルネットワーク / Neural Network / NN
事前に基底関数の数を固定し、データに適応させるアルゴリズム.
つまり、基底関数に対して、パラメトリック形を用いて、そのパラメータを訓練中に適応させるアルゴリズム.
ニューラルネットワークを (パーセプトロンを、1 層のニューラルネットとして)、多層パーセプトロン (MLP) と
考える場合もあるが、非連続な非線形性を持つ MLP と比べ、NN は連続的な非線形性を持つ.
Deep Neural Network / DNN
ニューラルネットワークを深く、多層化したネットワークを
Deep Neural Network / DNN と呼んでいる.
- Deep Neural Network / DNN
Deep Neural Network には、いくつかのネットワークアーキテクチャがあり、
単純な基本的なネットワークとして、順伝播ネットワーク / フィードフォワードネットワークがある.
- フィードフォワードネットワーク / Feed Forward Network / FFN
応用アーキテクチャ
Skip Layer Connection
Skip Layer Connection を追加したネットワークアーキテクチャ.
- Skip Layer Connection
CNN
- Convolutional Neural Network / CNN
- FNN に畳み込み演算を加えた
- yhayato1320.hatenablog.com
RNN
- Recurrent Neural Network / RNN
- FNN に再帰的な仕組みを追加
- yhayato1320.hatenablog.com
Attention
- Attention
Transformer
- Transformer
BERT
GPT
GNN
TabNet
- TabNet
DualNet / 2017
- DualNet: Learn Complementary Features for Image Recognition
工夫・テクニック
Zero / One / Few Shot Learning
- Zero / One / Few Shot Learning
活性化関数 / Activation Function
- 活性化関数 / Activation Function
正規化 / Normalization
- Normalization
Neural Architecture Search / NAS
- Neural Architecture Search / NAS
Pre Training / 事前学習
- Pre Training / Fine Turning
基盤モデル / Foundation Model
- 基盤モデル / Foundation Model
Weight Initialization
- Weight Initialization
表現学習 / Representation Learning
- 表現学習 / Representation Learning
誤差関数 / Loss Function
- 誤差関数 / Loss Function
正則化 / Regularization
- 正則化 / Regularization
Metric Learning / Distance Learning
- Metric Learning / Distance Learning
- Deep Metric Learning
- yhayato1320.hatenablog.com
勾配の計算 / Gradient
どのように勾配を計算するか.
誤差逆伝播法 / Error Backpropagation
Forward Gradient / 2022
- Gradients without Backpropagation
- [2022]
- arxiv.org
Forward-Forward / 2022
The Forward-Forward Algorithm: Some Preliminary Investigations
https://neurips.cc/virtual/2022/invited-talk/55869
- keras での実装について
最適化 / Optimization
勾配情報をどのように利用するか.
- Optimization
Neural Functional Networks / NFN / 2023
- Permutation Equivariant Neural Functionals
- [2023]
- arxiv.org
- github.com
応用的な研究
Meta Learning
- Meta Learning
Knowledge Distillation
Data Distillation
- Data Distillation
Model Compression / モデルの圧縮・軽量化
- Model Compression
Grokking
- Grokking
Scaling Law / スケーリング則
- Scaling Law / スケーリング則
平坦解 / Flat Minima
- 平坦解 / Flat Minima
モデルへの攻撃 / Attack
- 攻撃 / Attack
モデルの性能評価
- モデルの性能評価
モデルの編集
- モデルの編集
Neural Field
- Neural Field
Transfer Learning / 転移学習
- Transfer Learning / 転移学習
Small Data
- Small Data
Calibration
Expectation Consistency / EC / 2023
- Expectation consistency for calibration of neural networks
- [2023]
- arxiv.org
Probabilistic Embedding
データを「点」ではなく「確率分布」として埋め込む「確率埋め込み」.
- Probabilistic Embeddings Revisited
- [2022]
- arxiv.org
世界モデル
- ChatGPTの中の"世界モデル"
モデル形式
深層学習のアルゴリズムにおける分類について.
Auto Regression Model / 自己回帰モデル
- Auto Regression Model / 自己回帰モデル
Generative Model / 生成モデル
- Generative Model / 生成モデル
GAN
タスク
- タスク一覧 #まとめ編
データ分野
自然言語処理
- 自然言語処理
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com
音声解析
- 音声解析
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com
時系列解析
- 時系列解析
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com
画像処理
- 画像処理
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com
テーブルデータ解析
- テーブルデータ解析
- 深層学習を用いたアルゴリズム
- yhayato1320.hatenablog.com
サービス
- github.com
- AI を利用したサービスのまとめ
参考
On generalization bounds for deep networks based on loss surface implicit regularization
- [2022]
- arxiv.org
- 深層学習が過学習を起こさない原理を、ニューラルネットワークがエネルギー曲面上で滞留する数学的理論を開発して説明した
- 深層学習が大自由度にも関わらず過学習しない原理は長年の未解明点であり、これを説明する理論を開発した
- 深層学習を効率的に制御するための理論の発展や、アルゴリズム開発・ネットワーク設計などへの工学的応用が期待される
- www.u-tokyo.ac.jp
Modular Deep Learning
- [2023]
- arxiv.org
The Little Book of Deep Learning
書籍
-
- 5 ニューラルネットワーク
- 5.1 フィードフォワードネットワーク
-
- 5 ニューラルネットワーク
-
- 12 ニューラルネットワーク 画像認識トレーニング
- [asin:B01HGIPIAK:detail]
ゼロから作る Deep Learning
- 3 ニューラルネットワーク
- 3.1 パーセプトロンからニューラルネットワークへ
- 3.2 活性化関数
- 4 ニューラルネットワークの学習
- 8 ディープラーニング
-
- 3 ニューラルネットワーク
これならわかる深層学習入門
Web サイト
Deep Learning: A Survey of Surveys
Understanding Deep Learning
高速な深層学習モデルアーキテクチャ2023
動画
- MIT Introduction to Deep Learning | 6.S191