オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】GPT-3

Index

GPT-3 とは

ネットワークアーキテクチャをスケールアップし、
事前学習するコーパスを大きくすることで、
ファインチューニングを行わずに(Zero-Shot)、
もしくは少量の学習データでのファインチューニング(Few-Shot)するだけで
複数のタスク(Multi Task)にて、精度を向上させる

基本的な方針は、このように GPT-2 と同様. yhayato1320.hatenablog.com

参考

  • Language Models are Few-Shot Learners
    • [2020 OpenAI] 発表論文
    • Abstract
    • arxiv.org

書籍

Web サイト