Index
Decision Transformer
オフライン強化学習の問題を言語モデリングようにして解くTransformer.
- 強化学習
- Transformer を用いた手法
- yhayato1320.hatenablog.com
応用
Multi-Game Decision Transformers / 2022
- Multi-Game Decision Transformers
- [2022]
- arxiv.org
ESPER / 2022
- You Can't Count on Luck: Why Decision Transformers and RvS Fail in Stochastic Environments
- [2022]
- arxiv.org
参考
- Decision Transformer: Reinforcement Learning via Sequence Modeling
- [2021]
- arxiv.org
Web サイト
NeurIPS 2022 参加報告 後編
- 強化学習
- オフライン強化学習
- blog.recruit.co.jp
- 強化学習
2022年の深層学習ハイライト
- Decision Transformer: Reinforcement Learning via Sequence Modeling
- qiita.com
Post
https://t.co/c8cSaJn2XL
— akira (@AkiraTOSEI) August 2, 2021
Transformerをオフライン強化学習に適用する研究。Transformerを用いることで、価値の最大化ではなく、所望の価値を実現する行動系列を出力させる。逐次予測を行うRLと異なり、Self-Attentionで行動系列全体を見て学習する。 pic.twitter.com/HnOeJ4mmmH