オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Scaled Cosine Attention

yhayato1320.hatenablog.com

Index

Scaled Cosine Attention

Attention の仕組みの中で利用されるスコア関数のひとつ.

yhayato1320.hatenablog.com

Swin Transformer V2 で、提案された.

yhayato1320.hatenablog.com

類似度の定義

 Sim(q_{i},\ k_{j})\ =\  \displaystyle \frac{cos(q_{i},\ k_{j})}{\tau}\ +\ B_{i,\ j}

参考

  • Swin Transformer V2: Scaling Up Capacity and Resolution
    • [2021]
    • 3 Swin Transformer V2
      • 3.2 Scaling Up Model Capacity
    • arxiv.org