オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Diffusion-LM

Index

Diffusion-LM

画像生成で利用される Diffusion Model を文章生成に応用.

Fine-Tuning せずに、Pre-Training された言語モデル (Language Model / LM) をそのまま利用する.

Plug and Play



Pre-Training された言語モデル (Language Model / LM) のパラメータを固定した上で (学習せずに)、 生成する条件を満たすかどうかの判定を行う分類器を別で作成し、その分類器の結果を使って 生成プロセスを操作する手法.

この手法を Diffusion Model に応用する.

参考

  • Diffusion-LM Improves Controllable Text Generation

Web サイト

  • NeurIPS 2022 参加報告 前編

  • Stanford AI Researchers Open-Source Diffusion-LM: A Novel And Controllable Language Model Based on Continuous Diffusions, Which Enables New Forms of Complex Fine-Grained Control Tasks