【深層学習】Layer Normalization

データサイエンスデータサイエンス-深層学習

yhayato1320.hatenablog.com Index Index Layer Normalization 利用しているアーキテクチャ参考 Layer Normalization DNN (Deep Neural Networks) で、計算コストを短縮する方法として、正規化 / Normalization がある. Batch Normalization では、正規化す…

#深層学習 #DeepLearning

2021-12-16

【深層学習】Post / Pre Normalization

データサイエンスデータサイエンス-深層学習

yhayato1320.hatenablog.com Index Index Post / Pre Normalization 利用されているアーキテクチャ参考 Post / Pre Normalization 機械翻訳のタスクで、Transformer の層を深くする研究にて、2 つの手法が提案されている. Post / Pre Normalization の適応 …

#深層学習 #DeepLearning

2021-12-16

【深層学習】正規化 / Normalization #まとめ編

データサイエンスデータサイエンス-深層学習

深層学習手法一覧 yhayato1320.hatenablog.com まとめ編一覧 yhayato1320.hatenablog.com Index Index Batch Normalization Layer Normalization Group Normalization Instance Normalization Conditional Instance Normalization Interpreting Instance Nor…

#深層学習 #DeepLearning

2021-12-16

【深層学習】GPT-3

データサイエンスデータサイエンス-深層学習

GPT-3 #まとめ編 yhayato1320.hatenablog.com Index Index GPT-3 とは参考書籍 Web サイト GPT-3 とはネットワークアーキテクチャをスケールアップし、事前学習するコーパスを大きくすることで、ファインチューニングを行わずに(Zero-Shot)、もしくは…

#深層学習 #DeepLeaning

2021-12-16

【深層学習】GPT-2

データサイエンスデータサイエンス-深層学習

GPT #まとめ編 yhayato1320.hatenablog.com Index Index GPT-2 とはアプローチ学習データ Byte Pair Encoding (BPE) ネットワークアーキテクチャ学習済みモデル gpt2-xl-japanese 参考 Web サイト GPT-2 とは複数のタスク(Multi Task) やドメイン(Multi …

#深層学習 #DeepLearning

2021-12-16

【深層学習】GPT #まとめ編

データサイエンスデータサイエンス-深層学習データサイエンス-自然言語処理

Index Index GPT GPT-1 / 2018 GPT-2 / 2019 GPT-3 / 2020 GPT-J / 2021 Codex / 2021 GPT-3.5 Series / 2021 Instruct GPT / 2022 Chat GPT / 2023 Contrastive Pre Training / CPT / 2022 SpikeGPT / 2023 GPT-4 HuggingGPT / 2023 FrugalGPT / 2023 特定…

#深層学習 #DeepLearning

2021-12-16

【深層学習】GPT-1

データサイエンスデータサイエンス-深層学習

yhayato1320.hatenablog.com Index Index GPT-1 とは学習の仕組み教師なし事前学習(Unsupervised Pre-Training) 教師あり学習ファインチューニング (Supervised Fine-Tuning) ネットワークアーキテクチャ教師なし事前学習(Unsupervised Pre-Training) 教…

#深層学習 #DeepLeaning

オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

2021-12-16から1日間の記事一覧

【深層学習】Layer Normalization

【深層学習】Post / Pre Normalization

【深層学習】正規化 / Normalization #まとめ編

【深層学習】GPT-3

【深層学習】GPT-2

【深層学習】GPT #まとめ編

【深層学習】GPT-1