オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Turning-NLG

Index

Index
Turning-NLG
- 大規模モデルゆえの工夫
- ハードウエアの工夫
参考

Turning-NLG

Transformer Base の LLM.

Transformer
- yhayato1320.hatenablog.com

大規模モデルゆえの工夫

モデル自体を複数の GPU のメモリに分割して学習.

ハードウエアの工夫

NVIDIA DGX-2を利用して、GPU 間の通信を高速化.

参考

Turing-NLG
- [2020 Microsoft]
- www.microsoft.com