オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】CenterNet

Index

CenterNet

CNN を用いた Object Detection / Pose Estimation のアルゴリズム.

変数定義

画像  I

 I\ \in\ R^{W\ \times\ H\ \times\ 3}



  •  W : 画像の幅
  •  H : 画像の高さ



予測する KeyPoint Heatmap.

KeyPoint Heatmap  \hat{Y}

 \hat{Y}\ \in\ [0,\ 1]^{\displaystyle \frac{W}{R}\ \times\ \displaystyle \frac{H}{R}\ \times\ C}



  •  R : Output Stride
  •  C : Keypoint の ID



 \hat{Y}_{x,\ y,\ c}\ =\ 1 は、Keypoint を表し、 \hat{Y}_{x,\ y,\ c}\ =\ 0 は、背景を表す.

Network

ResNet / DAL などの CNN を利用.

Ground Truth

Keypoint

Ground Truth Keypoint  p

 p\ \in\ R^{2}

Keypoints Heatmap

Ground Truth KeyPoint Heatmap  Y

Gaussian Kernel  Y_{xyc} を利用して、Ground Truth Keypoint を Heatmap  Y に変換する.



 Y\ \in\ [ 0,\ 1]^{\displaystyle \frac{W}{R}\ \times\ \displaystyle \frac{H}{R}\ \times\ C}

Loss

 L_{k}\ =\ 
\left\{
\begin{array}{ll}
-\ \displaystyle \frac{1}{N}\ (1\ -\ \hat{Y}_{xyc})^{\alpha}\ \log(\hat{Y}_{xyc}) & if\ Y_{xyc}\ =\ 1 \\
-\ \displaystyle \frac{1}{N}\ (1\ -\ Y_{xyc})^{\beta}\ (\hat{Y}_{xyc})^{\alpha}\ \log(1\ -\ \hat{Y}_{xyc}) & otherwise
\end{array}
\right.

参考

  • Objects as Points
    • [2019]
    • 3 Preliminary
    • 4 Objects as Points
    • arxiv.org

Web サイト

  • 論文まとめ:Objects as Points