Index
生成モデル
真のデータ分布 に近似した生成モデル / モデル分布 を求めたい.
主に、深層学習を用いた手法についてまとめる.
- 深層学習 #まとめ編
Generative Adversarial Network / GAN
Generator と Discriminator 2 つのネットワークを利用するモデル.
潜在変数を利用するモデル.
GAN #まとめ編
Style Space
- [2020]
- yhayato1320.hatenablog.com
Variational Auto Encoder / VAE
- VAE #まとめ編
Flow Base Model
- Flow Base Model #まとめ編
Diffusion Model
- Diffusion Model #まとめ編
Growing NCA
- Growing NCA
Consistency Model
- Consistency Models
- [2023]
- arxiv.org
アルゴリズム
Riemannian Flow Matching / RFM / 2023
リーマン多様体上の連続正規化フローに基づく生成モデルを学習する.
拡散過程は簡単な多様体では測地線の距離、一般にはスペクトル距離で定義され、後は通常のフローマッチング同様に学習する.
- Riemannian Flow Matching on General Geometries
- [2023]
- arxiv.org
Reduce, Reuse, Recycle / 2023
スコアでなくエネルギーでモデル化し、それを使った焼きなましMCMCで合成後分布から生成できる.
- Reduce, Reuse, Recycle: Compositional Generation with Energy-Based Diffusion Models and MCMC
- [2023]
- arxiv.org
様々なモデルの分類方法
潜在変数モデル
潜在変数 を入力として用意し、 (生成器 / Generator) をモデル化する.
- GAN
- VAE
- Flow
自己回帰モデル
を直接モデル化する.
NADE
- [2011]
- [2011]
Pixel RNN / Pixel CNN / 2016
Diffusion Model #まとめ編
エネルギーベースモデル
- エネルギーベースモデル
- yhayato1320.hatenablog.com
- Restricted Boltzmann Machine / RBM
尤度ベースモデル vs 暗黙的生成モデル
尤度ベースモデル
- yhayato1320.hatenablog.com
- VAE / 自己回帰モデル / フローモデル / エネルギーベースモデル
暗黙的生成モデル
尤度ベースモデル
暗黙的生成モデル
- メリット
- 分配関数を明示的に扱う必要がなく、高い表現力をもったモデルを生成に使うことができる
- デメリット
- 生成モデルと識別モデル間で競合しながら学習する必要があり、学習が不安定になる
- 学習がどの程度進んでいるのかを示す指標がなく、生成したデータを人が目で確認して進捗を確認する必要がある
- メリット
スコアベースモデル / SBM
- スコアベースモデル / SBM
モデルの比較と分類
潜在変数への変換
深層生成モデルの分類例
タスク
Vision Language
- Vision Language
画像生成
参考
Self-supervised Learning: Generative or Contrastive
- [2020]
- 3 Generative Self-supervised Learning
- 3.1 Auto-regressive (AR) Model
- 3.2 Flow-based Model
- 3.3 Auto-encoding (AE) Model
- 3.3.4 Variational AE Model
- 4 Contrastive Self-supervised Learning
- 5 Generative-Contrastive (Adversarial) Self-supervised Learning
- 6 Theory behind Self-supervised Learning
- 6.1 GAN
- arxiv.org
Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models
- [2022]
- arxiv.org
Discovering Bugs in Vision Models using Off-the-shelf Image Generation and Captioning
- [2022]
- arxiv.org
ChatGPT is not all you need. A State of the Art Review of large Generative AI models
- [2023]
- arxiv.org
Regulating ChatGPT and other Large Generative AI Models
- [2023]
- arxiv.org
- A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT
- [2023]
- arxiv.org
書籍
生成 Deep Learning / オライリー
- [2020]
- 3 変分オートエンコーダ
- 4 敵対的生成ネットワーク
-
物体検出とGAN、オートエンコーダー、画像処理入門 PyTorch/TensorFlow2による発展的・実装ディープラーニング
GANディープラーニング実装ハンドブック
- [2021]
-
拡散モデル
- 1 生成モデル
- 1.3 学習手法
- 尤度ベースモデル / 暗黙的生成モデル
- 1.3 学習手法
- 1 生成モデル
Web サイト
pytorch-generative
- Autoregressive Models
- PixelSNAIL
- ImageGPT
- Gated PixelCNN
- PixelCNN
- MADE
- NADE
- FVSBN
- Variational Autoencoders
- VD-VAE
- VAE
- BetaVAE
- VQ-VAE
- VQ-VAE-2
- github.com
- Autoregressive Models
Generative AI Database: Types, Models, Sector, URL, API & more.
- 生成モデルのまとめ
- aaronsim.notion.site
画像生成AIのしくみ【前編】 AIに言葉を理解させる技術
画像生成AIのしくみ【後編】 AIの絵筆はどんな形?「画像生成器」について知る
生成モデルは世界をどのように理解しているのか
Ten Years of AI in Review
動画
- Generative Adversarial Networks (GANs) and Stable Diffusion