オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【マルチモーダル】ICMLM

Index

ICMLM

画像系のタスクでの事前学習の研究.

Masked Language Model に視覚情報を追加した.

Image-Conditioned Masked Language Modeling



参考

  • Learning Visual Representations with Caption Annotations