オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【マルチモーダル】Dense Captioning

Index

Dense Captioning

アルゴリズム

GRiT / 2022

  • GRiT: A Generative Region-to-text Transformer for Object Understanding

ControlCap / 2024

  • ControlCap: Controllable Region-level Captioning

データセット / ベンチマーク

Visual Genome / 2016

参考

Web ページ