オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Vision Transformer Tracker / ViTT

Index

Vision Transformer Tracker / ViTT

Transformer を利用した Object Tracking.

Tracking Algorithm

画像情報を利用し、 DeepLearning を用いた Tracking Algorithm は、いくつか種類がある.



  • CNN のみを利用して、Tracking を行う
  • CNN で特徴量抽出を行い、Transformer を利用して、Tracking を行う
  • Transformer のみを利用して、Tracking を行う.

Method

精度比較

MOT16 benchmark

実装

参考

  • ViTT: Vision Transformer Tracker
    • [2021]
    • 1 Introduction
    • 3 Method
      • 3.1 Architecture
      • 3.2 Image Serialization
      • 3.3 Encoder
      • 3.4 Multi-Task Learning
        • 3.4.1 Object Detection
        • 3.4.2 Identity Embedding
      • 3.5 Loss Functions
    • 4 Experiments and Discussion
      • 4.3 Results
    • www.mdpi.com