オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Chain-of-Thought / CoT

Index

Chain-of-Thought

LLM におけるコンテキスト内学習 / In Context Learning での工夫.

主に、プロンプト (入力テキスト) に対する工夫.

プロンプト

例えば、「りんごが12 個あります。2 個を食べ、4 個をアップルパイに使いました。 残りは何個あるでしょうか?」のようなテキストを入力として、タスクを解く.

改善内容

コンテキスト内学習 / In Context Learning の課題として、上のプロンプトのような 2 つ以上の思考ステップを踏むような問題は難しい.

「プロンプトに入れる具体的な回答部分に思考過程を含める」ことで改善.

工夫・テクニック

Automatic Reasoning and Tool-use / ART / 2023

  • ART: Automatic multi-step reasoning and tool-use for large language models

画像への応用

  • Multimodal Chain-of-Thought Reasoning in Language Models

参考

  • Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

Web サイト