Index
GLIDE
Diffusion Model を利用した画像の生成アルゴリズム.
- Diffusion Model
2 つの異なるガイダンスで構成されている.
- CLIP ガイダンス
- Classifier Free ガイダンス
Diffusion Model
生成モデルの仕組みに Diffusion Model を利用.
Guided Diffusion
Diffusion Model の1 つで、条件付き確率を導入したモデル.
条件として入力される情報が、教師データ (=Guidance) の役割をしている.
Classifier-Free Guidance
分類器を利用しない、Guided Diffusion
CLIP (Classifier) Guidance
テキストと画像間の共同表現を学習する.
CLIP モデルは、画像エンコーダとキャプションエンコーダの 2 つで構成されている.
参考
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
- [2021 OpenAI]
- Abstract
- 1 Introduction
- 2 Background
- 2.1 Diffusion Models
- 2.2 Guided Diffusion
- 2.3 Classifier-free guidance
- 2.4 CLIP Guidance
- arxiv.org
Diffusion Models Beat GANs on Image Synthesis
- [2021 OpenAI]
- 4 Classifier Guidance
- arxiv.org
Web サイト
OpenAI Releases GLIDE: A Scaled-Down Text-to-Image Model That Rivals DALL-E Performance
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
OpenAI、文章から画像を生成する新モデル「GLIDE」 前モデルよりも高品質な画像を生成
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing