オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】BERT #まとめ編 #00

データサイエンスデータサイエンス-深層学習

Index

Index
BERT / 2018
- アルゴリズム編
- 実装編
BERT の研究
学習するドメインに対する研究
他データ分野への応用
- HuBERT / 2021
モデル
サービス・アプリケーション
参考

BERT / 2018

自然言語処理における深層学習を用いたアルゴリズム.

Transformer をベースとしている.

Transformer まとめ編
- yhayato1320.hatenablog.com

アルゴリズム編

アルゴリズム編
- yhayato1320.hatenablog.com

実装編

実装編
- yhayato1320.hatenablog.com

BERT の研究

RoBERTa / 2019

Meta（旧Facebook）がハイパーパラメーターの調整や学習用データ量の増加によって、BERTの精度を大幅に上回る RoBERTa を発表.

Robustly Optimized BERT Approach

RoBERTa
- yhayato1320.hatenablog.com

ALBERT / 2019

GoogleがBERTを軽量化した ALBERT を発表.

ALBERT
- yhayato1320.hatenablog.com

DistilBERT / 2019

DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter
- [2019 Hugging Face]
- Ditillation(蒸留)の手法を用いてモデルを軽量化
- arxiv.org

FlauBERT / 2019

FlauBERT: Unsupervised Language Model Pre-training for French
- [2019]
- arxiv.org

Sentence BERT / SBERT / 2019

Sentence BERT / SBERT
- [2019]
- yhayato1320.hatenablog.com

GAN-BERT / 2020

GAN-BERT: Generative Adversarial Learning for Robust Text Classification with a Bunch of Labeled Examples
- [2020 ACL]
- aclanthology.org

DeBERTa / 2020

DeBERTa
- yhayato1320.hatenablog.com

学習するドメインに対する研究

BERT #まとめ編
- yhayato1320.hatenablog.com

他データ分野への応用

HuBERT / 2021

HuBERT: Self-Supervised Speech Representation Learning by Masked Prediction of Hidden Units
- [2021]
- arxiv.org
HuBERTで音声言語モデルの性能を改善
- techblog.yahoo.co.jp

rinna社が日本語の音声に特化した事前学習モデル HuBERT を、商用利用可能なApache-2.0 ライセンスで公開.

約19,000時間の日本語音声コーパスReazonSpeechを用いて学習.

huggingface.co

モデル

Pretrained Japanese BERT models
- github.com

サービス・アプリケーション

LINE DistilBERT
- engineering.linecorp.com

参考

最近、人工知能による自然言語処理が爆発的に進化しているのでまとめてみた。【中編】
- 3 大規模言語モデルの開発
  - 3.1 言語モデルBERTの改良
    - MT-DNN
    - XLNet
    - RoBERTa
    - ALBERT
    - T5
    - ELECTRA
    - ERNIE
- note.com
Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜
- www.ai-shift.co.jp