Index
点推定における最尤法
ベルヌーイ分布の例
1 をとる確率が 、0 をとる確率が
のベルヌーイ分布
が母集団分布の場合を考える.
推定すべき未知の母数は であるが、
の
の標本が得られたとする.
は 0 から 1 までの間の値をとる可能性があるが、母数 / パラメータがとりうる値の集合を
母数空間 / Parameter Space とよび、
で表す.
最尤原理 / Principle Of Maximum Likelihood Method
我々が採用する原理は、最尤原理 / Principle Of Maximum Likelihood Methodといわれ、
「現実の標本は確率最大のものが実現した」という仮定である.
この標本が得られる確率は、
であるが、例えば、 と
を考えた場合、
で、
となり、
で、
となるので、
の方が大きい.
したがって、 のほうが尤もらしく、推定値として適当であると判断する.
尤度 / 尤度関数
は、母数 / パラメータ空間
での
のいろいろな値における
尤もらしさを表す関数とみなすことができ、このように尤もらしさを尤度 / Likelihood、
その関数を尤度関数 / Likelihood Function とよぶ.
最尤法 / 最尤推定 / Maximum Likelihood Method
最尤法は、尤度関数を母数 / パラメータ空間 で最大にするものを推定値や推定量とするもので、
尤度関数を最大にする値が、最尤推定値、関数としては、最大推定量である.
ベイズの観点
多項式フィッティングの例 / 尤度関数
多項式フィッティングにおける などのパラメータ推定にも、この考えは適用できる.
観測データ への多項式フィッテングを適用する.
このとき、パラメータ には、事前に決めている分布があることを再確認する.
そして、このときのデータに対する評価を のような条件付き確率で表現する.
これを尤度関数 (Likelihood Function) とよぶ.
これは、パラメータ
「どれくらい起こりやすいか」とは、 パラメータ
このようにして、データ を観測した事後に
に関する
不確実性を事後分布
の形式で表現できる.
尤度の定義から、ベイズの定理は以下のように表現できる.
尤度関数
上にも、データを評価する指標として利用した尤度は、
ベイズ主義と頻度主義の両方のパラダイムで、重要な役割を果たす.
しかしながら、それをどう使うかは 2 つのアプローチで根本的に異なる.
頻度主義の尤度
頻度主義的な設定では、 は固定したパラメータと考えられ、
その値は、(母集団分布の)何らかの「推定量」として定められ、
この推定の誤差範囲はデータ集合
の (標本) 分布を考慮して得られる.
まずは、データ集合の母集団分布があり、
サンプリングされ、データ集合が観測される.
そこへ、推定されたパラメータを持つ多項式がフィティングされる.
このとき尤度関数 は、観測データ
が
真の値
から離れれば離れるほど小さくなり、
大きい方がこの母集団分布の仮説が正しいことを表す指標になる.
ベイズの尤度
一方ベイズ的な見方では、ただ 1 つの (つまり実際観測された) データ集合 があって、
パラメータに関する不確実性は
の確率分布として表される.
まずは、観測されたデータがあって、
事前に決めたパラメータの確率分布を、パラメータの不確実性として、データとの相性を測る.