Index
モーメンタム / Momentum
モーメンタム / Momentum は勾配法の(パラメータ空間内での)振動(=無駄な動き)を抑制し、極小値への収束性を改善する.
モーメンタム / Momentum とは「運動量 / 慣性」という意味.
物理学に関連がある. 前時刻での勾配の影響を引きずらせることで振動を防ぐ.
振動の原因は、各更新時ごとの急激な勾配ベクトルの向きの変化にある.
そこで、1つ前の更新での勾配ベクトルを影響させることで、毎回異なる方向ではなく、
前回方向に近い勾配ベクトルをパラメータ更新に影響させることができる.
更新アルゴリズム
Momentum では、新しく という変数が登場させる.
の更新 (式1.1) では、パラメータ点の更新ベクトル
(移動する速さ・大きさ、移動する方向)を調整しており、
次の の更新 (式1.2) で、パラメータ点を更新 (パラメータ空間の移動) を行っている.
式(1.1) は、以下のようにも表されることもある.
この場合、 が学習率のような役割をする.
モーメンタムは、振動を防ぐだけでなく、パラメータ空間の斜面では、パラメータ更新を加速してくれる.
物理学からの観点
この は、物理学でいう「速度」に対応していると考えることもできる.
そのように考えると、 (式1.1) では、物体が勾配方向に力を受け、その力によって物体の速度が加算されていくことを表している.
また、 は、物理学でいる空気抵抗や、摩擦の役割で、徐々に減速させている(移動距離を減らしている)と考える.
そのように考えると、 (式1.1) では、物体が勾配方向に力を受け、その力によって物体の速度が加算されていくことを表している.
また、 は、物理学でいる空気抵抗や、摩擦の役割で、徐々に減速させている(移動距離を減らしている)と考える.
参考
ゼロから作るDeepLearning
- 6 学習に関するテクニック
- 6.1 パラメータの更新
- 6.1.4 Momentum
- 6.1 パラメータの更新
- 6 学習に関するテクニック
機械学習スタートアップシリーズ これならわかる深層学習入門
- 4 勾配降下法による学習
- 4.2 勾配降下法の課題
- 4.2.2 モーメンタム法
- 4.2 勾配降下法の課題
- 4 勾配降下法による学習