オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Imagen

Index

Index
Imagen
応用
- DeepFloyd IF
参考
- Web サイト
- Post

Imagen

Diffusion Model を用いた Text to Image のアルゴリズム.

Diffusion Model #まとめ編
- yhayato1320.hatenablog.com
Text to Image #まとめ編
- yhayato1320.hatenablog.com

応用

DeepFloyd IF

Stability AIが大規模言語モデルを取り入れた高性能なテキストから画像への変換モデル「DeepFloyd IF」を発表
- ja.stability.ai
IF by DeepFloyd Lab at StabilityAI
- github.com

参考

Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding
- [2022]
- arxiv.org
- imagen.research.google

Web サイト

DALL·E 2 を早くも破る！超リアル画像生成モデル Imagen を解説
- ja.stateofaiguides.com

Post

https://t.co/yZQaRIXECg
非常に強力なtext-to-image生成器Imagenを提案。COCOで学習させてないにもかかわらず、FIDスコアでSOTAを達成。テキストエンコーダーを巨大化することで性能を向上、画素の値域を[-1,1]ではなく動的に変える、Classifier-freeの条件付き方法の使用、などの工夫がある。 pic.twitter.com/GtSO740xNv
— akira (@AkiraTOSEI) May 26, 2022