オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Auto Regression Model / 自己回帰モデル #まとめ編 #01

Index

Transformer-Decoder

「GPT-2」のように、Transformer の Decoder 部分を重ねた構造のモデルを「Auto Regression Model / 自己回帰モデル」 と呼ぶ. 得意なタスクは「テキスト生成」.

ニューラル言語モデルをベースにしている.

アルゴリズム

GPT / 2018 -

CTRL / 2019

  • CTRL
    • [2019]
    • CTRL: A Conditional Transformer Language Model for Controllable Generation
    • arxiv.org

Transformer-XL / 2019

XLNet / 2019

Reformer / 2020