オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】強化学習 / Reinforcement Learning

Index

強化学習 / Reinforcement Learning

Transformer を利用した強化学習の手法をまとめる.

アルゴリズム

Decision Transformer / 2022

Preference Transformer / 2023

  • Preference Transformer: Modeling Human Preferences using Transformers for RL

transformer-based world model / TWM / 2023

  • Transformer-based World Models Are Happy With 100k Interactions