Index
CLIP とは
CLIP #アルゴリズム編
CLIP #まとめ編
タスク
画像分類 / 物体認識 の予測処理を確認する.
分類するカテゴリに関しては、変更可能であることも確認する.
データセット
COCO を利用.
- COCO / Common Object in Context
実装
実行環境
ソースコード
OpenAI 公式のソースコードを利用.
学習済みモデル
こちらも、OpenAI が提供している学習済みモデル (英語) を利用する.
以下のアーキテクチャで学習したモデルの利用が可能.
- ResNet-50
- ResNet-101
- ViT-B/32
- ViT-B/16
- ViT-L/14