オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【データセット】WebImageText

データサイエンスデータサイエンス-マルチモーダル

yhayato1320.hatenablog.com

Index

Index
WebImageText
- 特徴
- データの取得
参考

WebImageText

CLIP というアルゴリズムが紹介された論文にて、作成されたデータセット.

CLIP
- yhayato1320.hatenablog.com

特徴

4 億の画像とテキストのペアのデータセット.
インターネットから検索を行うことで、情報を取得.
多様なデータが取得できることが望ましいので、50 万のクエリで検索.

データの取得

データは公開されておらず、データの作成手順のみ公開されている模様.

github issue
- github.com

検証用のデータセットは、公式の github から提示されている.

公式のgithubより
- github.com

参考

Learning Transferable Visual Models From Natural Language Supervision
- [2021 OpenAI]
- 2 Approach
  - 2.2 Creating a Sufficiently Large Dataset
- arxiv.org