2022-03-25 【マルチモーダル】Visual N-Grams データサイエンス データサイエンス-マルチモーダル Visual N-Grams 画像分類 / 物体認識の手法. 人の手でアノテーションされたラベルを使わずに、画像に関連する文章を使って学習する. Natural Language Supervision yhayato1320.hatenablog.com 画像に関する文章のどこに注目したのかを、表現できる N-Gram モデルを利用. N-Gram yhayato1320.hatenablog.com N-Gram Language Model 参考 Learning visual n-grams from web data [2016] Abstract arxiv.org