Index
点推定における最尤法
ベルヌーイ分布の例
1 をとる確率が 、0 をとる確率が のベルヌーイ分布 が母集団分布の場合を考える.
推定すべき未知の母数は であるが、
の の標本が得られたとする.
は 0 から 1 までの間の値をとる可能性があるが、母数 / パラメータがとりうる値の集合を 母数空間 / Parameter Space とよび、 で表す.
最尤原理 / Principle Of Maximum Likelihood Method
我々が採用する原理は、最尤原理 / Principle Of Maximum Likelihood Methodといわれ、
「現実の標本は確率最大のものが実現した」という仮定である.
この標本が得られる確率は、
であるが、例えば、 と を考えた場合、
- で、 となり、
- で、 となるので、
の方が大きい.
したがって、 のほうが尤もらしく、推定値として適当であると判断する.
尤度 / 尤度関数
は、母数 / パラメータ空間 での のいろいろな値における 尤もらしさを表す関数とみなすことができ、このように尤もらしさを尤度 / Likelihood、 その関数を尤度関数 / Likelihood Function とよぶ.
最尤法 / 最尤推定 / Maximum Likelihood Method
最尤法は、尤度関数を母数 / パラメータ空間 で最大にするものを推定値や推定量とするもので、 尤度関数を最大にする値が、最尤推定値、関数としては、最大推定量である.
ベイズの観点
多項式フィッティングの例 / 尤度関数
多項式フィッティングにおける などのパラメータ推定にも、この考えは適用できる.
観測データ への多項式フィッテングを適用する.
このとき、パラメータ には、事前に決めている分布があることを再確認する.
そして、このときのデータに対する評価を のような条件付き確率で表現する.
これを尤度関数 (Likelihood Function) とよぶ.
これは、パラメータ を固定したときに 観測されたデータ集合が「どれくらい起こりやすいか」を表している.
「どれくらい起こりやすいか」とは、 パラメータ にある分布を事前に仮定しており、 その仮定どおりにデータが存在しているか、 つまりどれくらいその仮定が正しいのかを表現している.
このようにして、データ を観測した事後に に関する
不確実性を事後分布 の形式で表現できる.
尤度の定義から、ベイズの定理は以下のように表現できる.
尤度関数
上にも、データを評価する指標として利用した尤度は、
ベイズ主義と頻度主義の両方のパラダイムで、重要な役割を果たす.
しかしながら、それをどう使うかは 2 つのアプローチで根本的に異なる.
頻度主義の尤度
頻度主義的な設定では、 は固定したパラメータと考えられ、
その値は、(母集団分布の)何らかの「推定量」として定められ、
この推定の誤差範囲はデータ集合 の (標本) 分布を考慮して得られる.
まずは、データ集合の母集団分布があり、
サンプリングされ、データ集合が観測される.
そこへ、推定されたパラメータを持つ多項式がフィティングされる.
このとき尤度関数 は、観測データ が 真の値 から離れれば離れるほど小さくなり、 大きい方がこの母集団分布の仮説が正しいことを表す指標になる.
ベイズの尤度
一方ベイズ的な見方では、ただ 1 つの (つまり実際観測された) データ集合 があって、
パラメータに関する不確実性は の確率分布として表される.
まずは、観測されたデータがあって、
事前に決めたパラメータの確率分布を、パラメータの不確実性として、データとの相性を測る.