Index
Vision Transformer Tracker / ViTT
Transformer を利用した Object Tracking.
Transformer #まとめ編
Object Tracking
Tracking Algorithm
画像情報を利用し、 DeepLearning を用いた Tracking Algorithm は、いくつか種類がある.
- CNN のみを利用して、Tracking を行う
- CNN で特徴量抽出を行い、Transformer を利用して、Tracking を行う
- Transformer のみを利用して、Tracking を行う.
Method
精度比較
MOT16 benchmark
実装
参考
- ViTT: Vision Transformer Tracker
- [2021]
- 1 Introduction
- 3 Method
- 3.1 Architecture
- 3.2 Image Serialization
- 3.3 Encoder
- 3.4 Multi-Task Learning
- 3.4.1 Object Detection
- 3.4.2 Identity Embedding
- 3.5 Loss Functions
- 4 Experiments and Discussion
- 4.3 Results
- www.mdpi.com