Index
Turning-NLG
Transformer Base の LLM.
- Transformer
大規模モデルゆえの工夫
モデル自体を複数の GPU のメモリに分割して学習.
ハードウエアの工夫
NVIDIA DGX-2を利用して、GPU 間の通信を高速化.
参考
- Turing-NLG
- [2020 Microsoft]
- www.microsoft.com
Transformer Base の LLM.
モデル自体を複数の GPU のメモリに分割して学習.
NVIDIA DGX-2を利用して、GPU 間の通信を高速化.