2024-03-26 【マルチモーダル】Phrase Grounding Index Index Phrase Grounding アルゴリズム GLIP / 2021 GLIP v2 / 2022 参考 Phrase Grounding 文章中のフレーズ・単語が、画像中のどの領域に対応するかを推定するマルチモーダルのタスク. マルチモーダル #まとめ編 Vision-Language yhayato1320.hatenablog.com アルゴリズム GLIP / 2021 GLIP yhayato1320.hatenablog.com GLIP v2 / 2022 GLIPv2: Unifying Localization and Vision-Language Understanding [2022] arxiv.org 参考 A Joint Study of Phrase Grounding and Task Performance in Vision and Language Models [2023] arxiv.org paperswithcode.com paper with code のタスクのページ