オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Reinforcement Learning from Human Feedback / RLHF

Index

Reinforcement Learning from Human Feedback / RLHF

人間によるフィードバックに基づいて、LLM を強化学習させる手法.

テクニック・工夫

ZO-RankSGD / 2023

  • Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles

画像への応用

  • Aligning Text-to-Image Models using Human Feedback

研究

  • The Capacity for Moral Self-Correction in Large Language Models

参考