オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】推定

Index

推定

推定とは、標本を元にその標本が抽出された元の母集団分布の母数 (パラメータ、母平均や母分散など) の値を定めることである.

たとえば、ある集団の所得分布が対数正規分布に従うといっても、 その平均、分散が知られていなければ、現実の分析に用いることはできない.

「どの対数正規分布か」がわからないからである.

また、人間の身体計測値が正規分布  N(\mu,\ \sigma^{2}) に従うといっても、 その平均や分散がわからなければ、洋服屋スポーツ用品店にとっては、何も意味もない.

推定の意義

上の例のように、これから扱おうとする母集団の母数 / パラメータは実際の問題では、未知であり、 これらを標本  X_1,\ \cdots,\ X_n から定める必要がある.

これを母数 / パラメータの推定 / Estimation という.

定量

推定する対象として、例を挙げるならば、標本平均や標本分散のように、 母集団分布の母数 / パラメータを推定するために、標本から求めた統計量を一般に定量と呼ぶ.

我々が推定しようとする母数 / パラメータ には、 母平均  \mu、母分散  \sigma^{2}、母相関係数  \rho など、 いろいろなものがあるが、一般性を持たせる場合には、推定しようとするパラメータを  \theta で表す.

定量は、母数 / パラメータ  \theta にハットをつけて、 \hat{\theta} のように表す.

様々な推定

点推定 / Point Estimation

母集団分布の母数 (パラメータ、母平均や母分散など) を1 つの値で指定する方法を点推定と呼ぶ.

区間推定 / Interval Estimation

「真のパラメータ」の値が入る確率が、ある値  1 - \alpha 以上と保証される区間を求める方法を区間推定という.

密度推定 / Density Estimation

参考