Index

Index
Decision Transformer
応用
- Multi-Game Decision Transformers / 2022
- ESPER / 2022
参考
- Web サイト
  - Post

Decision Transformer

オフライン強化学習の問題を言語モデリングようにして解くTransformer.

強化学習
- Transformer を用いた手法
- yhayato1320.hatenablog.com

応用

Multi-Game Decision Transformers / 2022

Multi-Game Decision Transformers
- [2022]
- arxiv.org

ESPER / 2022

You Can't Count on Luck: Why Decision Transformers and RvS Fail in Stochastic Environments
- [2022]
- arxiv.org

参考

Decision Transformer: Reinforcement Learning via Sequence Modeling
- [2021]
- arxiv.org

Web サイト

NeurIPS 2022 参加報告後編
- 強化学習
  - オフライン強化学習
- blog.recruit.co.jp
2022年の深層学習ハイライト
- Decision Transformer: Reinforcement Learning via Sequence Modeling
- qiita.com

Post

https://t.co/c8cSaJn2XL
Transformerをオフライン強化学習に適用する研究。Transformerを用いることで、価値の最大化ではなく、所望の価値を実現する行動系列を出力させる。逐次予測を行うRLと異なり、Self-Attentionで行動系列全体を見て学習する。 pic.twitter.com/HnOeJ4mmmH
— akira (@AkiraTOSEI) August 2, 2021

オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Decision Transformer

Index

Decision Transformer

応用

Multi-Game Decision Transformers / 2022

ESPER / 2022

参考

Web サイト

Post