- Transformer
Index
ToMe
参考
Transformerで処理中にトークン集合を二つにわけ(A, B)、
A中の各トークンで最も似ているB中のトークンを求め、
最も似ている上位ペアr%をマージし、
トークンを減らして処理をする.
key表現の近さで似ているかを判定する.
key表現の近さで似ているかを判定する.
- Token Merging: Your ViT But Faster
- [2022]
- arxiv.org
Post
https://t.co/rstX10WL4B
— akira (@AkiraTOSEI) November 6, 2022
似たトークンを徐々に結合していくことにより、精度をあまり落とさずにスループットを2倍にするToMeを提案。key同士の距離を測り、ブロックごとにマージする箇所を決める。SwinのShifted Windowsよりも自然なトークンの結合ができるとのこと。 pic.twitter.com/pjSHLRZ9e0