オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Vision Transformer Tracker / ViTT

データサイエンスデータサイエンス-深層学習

Index

Index
Vision Transformer Tracker / ViTT
- Tracking Algorithm
Method
精度比較
実装
参考

Vision Transformer Tracker / ViTT

Transformer を利用した Object Tracking.

Transformer #まとめ編
- yhayato1320.hatenablog.com
Object Tracking
- yhayato1320.hatenablog.com

Tracking Algorithm

画像情報を利用し、 DeepLearning を用いた Tracking Algorithm は、いくつか種類がある.

CNN のみを利用して、Tracking を行う
CNN で特徴量抽出を行い、Transformer を利用して、Tracking を行う
Transformer のみを利用して、Tracking を行う.

Method

精度比較

MOT16 benchmark

実装

github.com

参考

ViTT: Vision Transformer Tracker
- [2021]
- 1 Introduction
- 3 Method
  - 3.1 Architecture
  - 3.2 Image Serialization
  - 3.3 Encoder
  - 3.4 Multi-Task Learning
    - 3.4.1 Object Detection
    - 3.4.2 Identity Embedding
  - 3.5 Loss Functions
- 4 Experiments and Discussion
  - 4.3 Results
- www.mdpi.com