オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【データセット】データセット一覧 #まとめ編

Index

系列データ

時系列データ

自然言語データ

音声データ

画像データ

3D

テーブルデー

複合データ

動画データ

マルチモーダルデータ

その他

地図データ

  • AWS、MS、Metaらがオープンな地図データを実現する「Overture Maps Foundation」結成 2023年前半にはデータ公開へ

Embodied / 身体性

MineDojo / 2022

3次元のサンドボックス型ゲーム『Minecraft』を元にしたEmbodied AIの訓練・評価のためのフレームワーク.

プレイ動画やwikiに蓄積されたデータも提供されており、ユーザであるAI開発者は本家ゲーム同様のオープンエンドな使い方も可能.

  • MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge

ProcTHOR / 2022

手続き的に生成された大規模なデータセットが、Embodied AIの訓練に役立つことを検証.

データセットへの評価

参考

書籍

Web サイト