Index
Dream LLM
VL のマルチモーダルの手法.
- Vision-Language #まとめ編
VL モデルの比較
CLIP - like
Flamingo / BLIP - like
Flamingo
BLIP
GILL / Emu - like
アーキテクチャ
参考
DreamLLM: Synergistic Multimodal Comprehension and Creation
DreamLLM : マルチモーダルの理解と創造の相互作用を備えたマルチモーダルLLM