Index
Flickr30k
画像と説明文のマルチモーダルなデータセット.
データセット #まとめ編
-
- HomePage
利用手段
Kaggle Dataset / torch vision でも利用できる.
Kaggle Dataset
Kaggle Notebook
torch vision
- pytorch.org
- Flickr30k Entities のデータセット
video を作ってみたよ!
参考
From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions
- aclanthology.org
- [2014]
Flickr30k entities: Collecting region-to-phrase correspondences for richer image-to-sentence models
- [2015]
- arxiv.org
-
- paper with code のデータのページ