オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【マルチモーダル】Visual N-Grams

Visual N-Grams

画像分類 / 物体認識の手法.

人の手でアノテーションされたラベルを使わずに、画像に関連する文章を使って学習する.

画像に関する文章のどこに注目したのかを、表現できる N-Gram モデルを利用.

N-Gram Language Model

参考

  • Learning visual n-grams from web data