オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【データセット】Flickr30k

Index

Flickr30k

画像と説明文のマルチモーダルなデータセット.

利用手段

Kaggle Dataset / torch vision でも利用できる.

video を作ってみたよ!

www.kaggle.com

参考

  • From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions

  • Flickr30k entities: Collecting region-to-phrase correspondences for richer image-to-sentence models

  • paperswithcode.com

    • paper with code のデータのページ

Web サイト