Index
Alignment / 協調性
LLM は、様々なタスクに適応する能力を有している一方、生成される文章の品質や正確さは最適とは言えない.
そこで、LLM の「Alignment / 協調性」という概念がある.
ユーザの指示を汲み取って適切な返答をするだけではなく、「社会通年に反しない」のような要求も含まれる.
Instruct GPT
Instruct GPT は、GPT-3 をベースにしたモデル.
- Instruct GPT
以下のように学習される.
- プロンプトと望ましい出力のペアを人手で作る.
- 上の「望ましい出力」を教師データとして、GPT-3 をファインチューニング
- プロンプトを GPT-3 に入れて複数の出力をサンプルし、人手で好ましい順に序列を与える
- 上の「好ましい順の序列」を教師データとして。報酬モデルを訓練する
- 上の「報酬モデル」を使って、「ファインチューニングした GPT-3」 を強化学習で学習する
参考
- NeurIPS 2022 参加報告 後編
- 大規模言語モデル
- 人間との協調
- blog.recruit.co.jp
- 大規模言語モデル