オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【マルチモーダル】VirTex

Index

VirTex

深層学習を用いた画像系のタスクへの事前学習の研究.

事前学習したモデルをダウンストリーム (下流) のタスクで、ファインチューニングし、精度を向上させる.

また、自然言語から、画像系のタスクを学習する.

Visual Representations from Textual annotations



参考

  • VirTex: Learning Visual Representations from Textual Annotations

Web サイト

  • VirTex: Learning Visual Representations from Textual Annotations