Index
WebImageText
CLIP というアルゴリズムが紹介された論文にて、作成されたデータセット.
特徴
- 4 億の画像とテキストのペアのデータセット.
- インターネットから検索を行うことで、情報を取得.
- 多様なデータが取得できることが望ましいので、50 万のクエリで検索.
データの取得
データは公開されておらず、データの作成手順のみ公開されている模様.
- github issue
検証用のデータセットは、公式の github から提示されている.
- 公式のgithubより
参考
- Learning Transferable Visual Models From Natural Language Supervision
- [2021 OpenAI]
- 2 Approach
- 2.2 Creating a Sufficiently Large Dataset
- arxiv.org