オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【データセット】WebImageText

yhayato1320.hatenablog.com

Index

WebImageText

CLIP というアルゴリズムが紹介された論文にて、作成されたデータセット.

特徴

  • 4 億の画像とテキストのペアのデータセット.
  • インターネットから検索を行うことで、情報を取得.
  • 多様なデータが取得できることが望ましいので、50 万のクエリで検索.

データの取得

データは公開されておらず、データの作成手順のみ公開されている模様.

検証用のデータセットは、公式の github から提示されている.

参考

  • Learning Transferable Visual Models From Natural Language Supervision
    • [2021 OpenAI]
    • 2 Approach
      • 2.2 Creating a Sufficiently Large Dataset
    • arxiv.org