Index

GLIDE

Diffusion Model を利用した画像の生成アルゴリズム.

2 つの異なるガイダンスで構成されている.

GLIDE : Guided Language to Image Diffusion for Generation and Editing.

生成モデルの仕組みに Diffusion Model を利用.

Diffusion Model の1 つで、条件付き確率を導入したモデル.

条件として入力される情報が、教師データ (=Guidance) の役割をしている.

$\begin{align} \hat{\mu}_{\theta}\ =\ &\mu_{\theta}\ (x_{t}\ |\ y) \\ &\ +\ s\ \cdot\ \Sigma\ (x_{t}\ |\ y) \end{align}$

分類器を利用しない、Guided Diffusion

テキストと画像間の共同表現を学習する.

CLIP モデルは、画像エンコーダとキャプションエンコーダの 2 つで構成されている.

GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
- [2021 OpenAI]
- Abstract
- 1 Introduction
- 2 Background
  - 2.1 Diffusion Models
  - 2.2 Guided Diffusion
  - 2.3 Classifier-free guidance
  - 2.4 CLIP Guidance
- arxiv.org
Diffusion Models Beat GANs on Image Synthesis
- [2021 OpenAI]
- 4 Classifier Guidance
- arxiv.org

OpenAI Releases GLIDE: A Scaled-Down Text-to-Image Model That Rivals DALL-E Performance
- DeepMind
- syncedreview.com
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
- youtube
- www.youtube.com
OpenAI、文章から画像を生成する新モデル「GLIDE」　前モデルよりも高品質な画像を生成
- www.itmedia.co.jp
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
- [DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing from Deep Learning JP
  www.slideshare.net