Index
DeBERTa
- BERT #まとめ編
DeBERTaV3 / 2021
- DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing
- [2021]
- arxiv.org
参考
DeBERTa: Decoding-enhanced BERT with Disentangled Attention
- [2020]
- arxiv.org
Web サイト
RoBERTaとDeBERTaの違いを整理
日本語DeBERTaモデルの構築