オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】DeBERTa

Index

Index
DeBERTa
- DeBERTaV3 / 2021
参考
- Web サイト
  - Post

DeBERTa

BERT #まとめ編
- yhayato1320.hatenablog.com

DeBERTaV3 / 2021

DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing
- [2021]
- arxiv.org

参考

DeBERTa: Decoding-enhanced BERT with Disentangled Attention
- [2020]
- arxiv.org
github
- github.com

Web サイト

RoBERTaとDeBERTaの違いを整理
- qiita.com
日本語DeBERTaモデルの構築
- jedworkshop.github.io

Post

https://t.co/8GG9cWURLd
文書の相対位置を示す行列を分離して計算させることでより位置を考慮させるdisentangled attentionと、decoderにtokenの絶対位置情報を与えるEnhanced Mask Decoderを組み合わせたDeBERTaを提案。SuperGLUEにおいて人間を超えるスコアを示す。 pic.twitter.com/ehCrBISGP9
— akira (@AkiraTOSEI) February 22, 2021