オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Reinforcement Learning from Human Feedback / RLHF

データサイエンスデータサイエンス-深層学習

Index

Index
Reinforcement Learning from Human Feedback / RLHF
テクニック・工夫
- ZO-RankSGD / 2023
画像への応用
研究
参考

Reinforcement Learning from Human Feedback / RLHF

人間によるフィードバックに基づいて、LLM を強化学習させる手法.

LLM
- yhayato1320.hatenablog.com
Instruct GPT / Chat GPT
- yhayato1320.hatenablog.com

テクニック・工夫

ZO-RankSGD / 2023

Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles
- [2023]
- arxiv.org

画像への応用

Aligning Text-to-Image Models using Human Feedback
- [2023]
- arxiv.org

研究

The Capacity for Moral Self-Correction in Large Language Models
- [2023]
- arxiv.org

参考

Illustrating Reinforcement Learning from Human Feedback (RLHF)
- huggingface.co
RLHF（Reinforcement Learning from Human Feedback：人間のフィードバックからの強化学習）とは？
- atmarkit.itmedia.co.jp