Index
ImageNet とは
ImageNetは、1400万枚以上もあるほど大規模な、「カラー写真」の教師ラベル付き画像データベース. その教師ラベルは、WordNet階層に基づいて付与されている. スタンフォード大学のフェイフェイ・リ(Fei-Fei Li)氏を中心とした研究グループが管理しており、 世界中の研究者や教育/学びに役立ててもらうためのリソースとして公開されている.
利用方法
ImageNetは、下記の公式ページからダウンロードできる.
参考
- ImageNet-21K Pretraining for the Masses
- [2021]
- arxiv.org
- 大規模な画像データセットである ImageNet-21K を効率的に活用し、高品質なモデルの事前学習を汎用化するための手法を提案. データの複雑さや不整合なラベル付けといった課題を解決するため、WordNetの階層構造を利用した新しい学習スキーム「Semantic Softmax」を開発. この手法は、従来の単一ラベル学習やマルチラベル学習の弱点を克服し、情報の豊富さと学習の安定性を両立. 実験の結果、大型モデルだけでなくモバイル向けの小型モデルにおいても、標準的な ImageNet-1K による学習を大幅に上回る精度向上が確認された.
Web サイト
- ImageNet:大規模なカラー写真の画像データベース