オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Turning-NLG

Index

Turning-NLG

Transformer Base の LLM.

大規模モデルゆえの工夫

モデル自体を複数の GPU のメモリに分割して学習.

ハードウエアの工夫

NVIDIA DGX-2を利用して、GPU 間の通信を高速化.

参考