オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】ToMe

Index

ToMe

参考

Transformerで処理中にトークン集合を二つにわけ(A, B)、 A中の各トークンで最も似ているB中のトークンを求め、 最も似ている上位ペアr%をマージし、 トークンを減らして処理をする.

key表現の近さで似ているかを判定する.



  • Token Merging: Your ViT But Faster