オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【データセット】ImageNet #概念編

Index

ImageNet とは

ImageNetは、1400万枚以上もあるほど大規模な、「カラー写真」の教師ラベル付き画像データベース. その教師ラベルは、WordNet階層に基づいて付与されている. スタンフォード大学のフェイフェイ・リ(Fei-Fei Li)氏を中心とした研究グループが管理しており、 世界中の研究者や教育/学びに役立ててもらうためのリソースとして公開されている.

利用方法

ImageNetは、下記の公式ページからダウンロードできる.

image-net.org

参考

  • ImageNet-21K Pretraining for the Masses
    • [2021]
    • arxiv.org
    • 大規模な画像データセットである ImageNet-21K を効率的に活用し、高品質なモデルの事前学習を汎用化するための手法を提案. データの複雑さや不整合なラベル付けといった課題を解決するため、WordNetの階層構造を利用した新しい学習スキーム「Semantic Softmax」を開発. この手法は、従来の単一ラベル学習やマルチラベル学習の弱点を克服し、情報の豊富さと学習の安定性を両立. 実験の結果、大型モデルだけでなくモバイル向けの小型モデルにおいても、標準的な ImageNet-1K による学習を大幅に上回る精度向上が確認された.

Web サイト