- #まとめ編 一覧
Index
動画像処理
動画像データを解析する際に発生する前処理などを記す.
Frame Sampling
動画像データから画像 (フレーム) をサンプリングし、シーケンシャルな (もしくはシーケンシャルでない) 画像データセットを作成する.
- Frame Sampling #まとめ編
アルゴリズム
X-CLIP / 2022
- X-CLIP
SAVi++
Slot Attention を動画に適用.
Slot Attention
SAVi++: Towards End-to-End Object-Centric Learning from Real-World Videos
- [2022]
- arxiv.org
テクニック・工夫
CNN
- CNN #まとめ編
Transformer
- Transformer #まとめ編
Diffusion Model
- Diffusion Model
Video MAE
Unmasked Teacher / 2023
- Unmasked Teacher: Towards Training-Efficient Video Foundation Models
- [2023]
- arxiv.org
- github.com
VideoMAE V2 / 2023
- VideoMAE V2: Scaling Video Masked Autoencoders with Dual Masking
- [2023]
- arxiv.org
タスク
- 動画像処理 タスク一覧
データセット
- 動画像データ
参考
- コンピュータービジョン最前線 Spring 2022
- 1 イマドキノ動画認識
- 1.1 はじめに
- 1.2 代表的な認識モデル
- 1.3 動画認識の各種タスク
- 1 イマドキノ動画認識
