Index
Imagen
Diffusion Model を用いた Text to Image のアルゴリズム.
Diffusion Model #まとめ編
Text to Image #まとめ編
応用
DeepFloyd IF
Stability AIが大規模言語モデルを取り入れた高性能なテキストから画像への変換モデル「DeepFloyd IF」を発表
IF by DeepFloyd Lab at StabilityAI
参考
- Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
- [2022]
- arxiv.org
- imagen.research.google
Web サイト
- DALL·E 2 を早くも破る!超リアル画像生成モデル Imagen を解説
Post
https://t.co/yZQaRIXECg
— akira (@AkiraTOSEI) May 26, 2022
非常に強力なtext-to-image生成器Imagenを提案。COCOで学習させてないにもかかわらず、FIDスコアでSOTAを達成。テキストエンコーダーを巨大化することで性能を向上、画素の値域を[-1,1]ではなく動的に変える、Classifier-freeの条件付き方法の使用、などの工夫がある。 pic.twitter.com/GtSO740xNv