オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【機械学習】ランジュバン・モンテカルロ法

Index

Index
ランジュバン・モンテカルロ法
- アルゴリズム
参考
- 書籍
- Web サイト

ランジュバン・モンテカルロ法

ランジュバン・モンテカルロ法は、スコアを使った MCMC 法.

MCMC 法
- yhayato1320.hatenablog.com
スコア
- yhayato1320.hatenablog.com

アルゴリズム

はじめに任意の事前分布 $\pi (x)$ からデータを $x_{0}\ \sim\ \pi(x)$ とサンプリングし、次に各位置でのスコアに従い推移する.

事前分布
- yhayato1320.hatenablog.com

この際、正規分布からサンプリングされたノイズを少し加えた上で遷移する.

この遷移を $K$ 回繰り返した結果を、サンプリング結果とする.

サンプリング

入力

$\alpha$ : ステップ幅
$K$ : ステップ回数

$x_{0}$ を初期化

$x_{0}\ \sim\ N(x_{0};\ 0,\ I)$

for $k\ =\ 1,\ \cdots,\ K$ do
- $u_{k}\ \sim\ N(0,\ I)$
- $x_{k}\ =\ x_{k\ -\ 1}\ +\ \alpha\ \nabla_{x}\ \log\ p(x_{k\ -\ 1}\ +\ \sqrt{2\alpha}\ u_{k}$
end for
return $x_{K}$

このとき、 $\alpha\ \rightarrow\ 0,\ K\ \rightarrow\ \infty$ で $x_{K}$ は $p(x)$ からのサンプルに収束する.

参考

Bayesian Learning via Stochastic Gradient Langevin Dynamics
- [2011]
- https://www.stats.ox.ac.uk/~teh/research/compstats/WelTeh2011a.pdf

書籍

拡散モデル
- 1 生成モデル
  - 1.5 スコア : 対数尤度の入力についての勾配
    - 1.5.1 ランジュバン・モンテカルロ法
- 拡散モデル　データ生成技術の数理
  - 作者:岡野原大輔
  - 岩波書店
  Amazon

Web サイト

【拡散モデル初心者向け】実装例から学ぶランジュバン・モンテカルロ法: Pytorch使用
- qiita.com