Index
Swin Transformer とは
Transformer を画像分野に適用した手法.
前置き
タスク
画像から特定の物体を検出する物体検出で、推論処理を確認する.
データセット
COCO データセットを利用.
物体検出のアルゴリズム
物体検出のBackbone に Swin Transformer を利用するが、
全体にフレームワークとしては、Mask R-CNNを利用.
実装
環境構築とライブラリ
Google Colaboratory (2022/02/27)
- cuda 11.1
Python (3.7.12)
- PyTorch (1.10.0+cu111)
- mmcv-full (1.4.0) : mmdet のバージョンに合わせた
- mmdet (2.11.0)
データセットを取得
コード(ライブラリ)と学習済みモデル
利用するコードは、mmdetection をフォークしている Swin-Transformer-Object-Detection を利用.
学習済みモデルは、mmdetection を利用.
推論の確認
推論結果
参考
- github.com
- notebook