オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Chain-of-Thought / CoT

データサイエンスデータサイエンス-深層学習

Index

Index
Chain-of-Thought
- プロンプト
- 改善内容
工夫・テクニック
- Automatic Reasoning and Tool-use / ART / 2023
画像への応用
参考
- Web サイト

Chain-of-Thought

LLM におけるコンテキスト内学習 / In Context Learning での工夫.

コンテキスト内学習 / In Context Learning
yhayato1320.hatenablog.com

主に、プロンプト (入力テキスト) に対する工夫.

プロンプト

例えば、「りんごが12 個あります。2 個を食べ、4 個をアップルパイに使いました。残りは何個あるでしょうか？」のようなテキストを入力として、タスクを解く.

改善内容

コンテキスト内学習 / In Context Learning の課題として、上のプロンプトのような 2 つ以上の思考ステップを踏むような問題は難しい.

「プロンプトに入れる具体的な回答部分に思考過程を含める」ことで改善.

工夫・テクニック

Automatic Reasoning and Tool-use / ART / 2023

ART: Automatic multi-step reasoning and tool-use for large language models
- [2023]
- arxiv.org

画像への応用

Multimodal Chain-of-Thought Reasoning in Language Models
- [2023]
- arxiv.org

参考

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
- [2022]
- v6
- arxiv.org

Web サイト

言語モデルに思考の連鎖を促し推論能力を向上(1/2)
- webbigdata.jp
言語モデルはバイアスに左右されやすい（CoTプロンプトの研究論文を読む）
- note.com