オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】CLIP #実装編 #03

Index

CLIP とは

前置き

タスク

画像とテキストの類似度を測定する.

データセット

犬.

学習済みモデル

日本語のモデルを作成してくださっているので、利用させていだだく.

  • 日本語の学習済みモデル

    • prtimes.jp
    • CLIP と CLOOB の学習済みモデル

  • huggingface.co

    • huggingface のページ

スクリプト

スクリプトは、rinna さんのコードを利用させていただく.

実装