オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】確率 #まとめ編

Index

確率 / Probability

様々な統計学とその確率.

確率 / Probability

確率とは、事象の起こりやすさ定量的に示すもので、 事象  A のおこる確率を Probability の頭文字をとって  P(A) で表す.

加法定理

複数の事象の和事象の確率を計算する方法のひとつとして、加法定理を利用することができる.

条件付き確率と乗法定理 / Conditional Probability

条件付確率は、別の事象の情報を元に、求めたい事象の確率をさらに正確に表現することができる.

同時確率 / Joint Probability

周辺確率

確率空間



標本空間  \Omega \Omega 上の  \sigma 集合体  F (事象の集合)、 確率測度  P (確率の計算方法)の組 ( \Omega,\ F,\ P) を確率空間と呼ぶ.



確率変数

確率的に変動する変数.

さらにいうと、とる値に対してそれぞれ確率が与えられている変数.

期待値と分散

確率変数の変換

確率変数を扱う上で、対数をとるなど確率変数の変換が重要となる.

標準化

歪度・劣度・モーメント

期待値、分散によって確率分布の様子はある程度わかるが、 位置とばらつきだけで確率分布の形がひととおりに決まるわけではない.

例えば、非対称ならばどちらへ歪んでいるかを表さなければならない.

確率分布の形が、つりがね型か、それより尖った尖塔型か、平型かをも知る必要がある.

確率分布の形状を知るための指標はいくつもある.

確率分布

各確率変数の各確率のことを確率分布という.

同時確率分布 / Joint Probability Distribution

 2 つの離散型の確率変数  X,\ Y が存在するとする.



 X のとりうる値は、 \{x_{1},\ x_{2},\ \cdots,\ x_{k}\}

 Y のとりうる値は、 \{y_{1},\ y_{2},\ \cdots,\ y_{l}\}



であるとする.

変数の組み合わせ  (X,\ Y) は、 k\ \times\ l 個の異なった値をとる.

 X\ =\ x_{i},\ Y\ =\ y_{j} となる確率は、



 P(X\ =\ x_{i},\ Y\ =\ y_{j})\ =\ f(x_{i},\ y_{j})



となるり、これを  X と、 Y同時確率分布と呼ぶ.

記述 / 古典 統計学

手元のデータ (標本) をどのようにわかりやすく表現するか.

1 次元のデータ

2 次元のデータ

単一の変数でなく、2 変数、3 変数などを観測して、  n 組のデータを得る場合、 そのデータを多次元データという.

一般に、 p 個の変数を取り扱う場合、 p 次元データという.

多次元データの統計学は、各変数間の関係を扱うことができる.

したがって、変数が増えれば増えるほど、変数の関係も個数も多くなる.

そのような多次元間の複雑な関係を解析する方法を多変量解析という.

変数間の関係

単純に 2 変数  x,\ y の関係を考えてみる.

 x y の間に区別を設けず、対等にみる見方や方法を 相関 Correlation といい、  x から  y (あるいは逆) をみるとき、 回帰 Regression という.

相関は、 x y の間の相互関係を、回帰は x から  y が決定される様子や程度を扱う.

中心極限定理

推計統計学 / 統計的推測

「母集団のすべてを得ることが難しく、母集団から標本を抽出したという前提のもと」 もしくは、「手元のデータ (標本) はある母集団からサンプリングされたものという仮定のもと」 母集団について分析する.

母集団の確率分布 (母集団分布) や確率モデルに関して、推測・推定する.

推測・推定するのは、母集団分布の母数 (パラメータ).

標本分布

我々が知りたいのは「母集団」に関することであることが多い.

標本から母集団を表現する方法の一つが標本分布である.

正規標本論

標本分布(論)は、母集団の分布が正規分布ならば、理論も応用もスムーズである.
母集団分布が正規分布であると仮定して、正規分布 (正規母集団) から標本の統計量の標本分布の計算を行うことを 正規標本論という.

推定

推定とは、標本を元にその標本が抽出された元の母集団分布の母数 (パラメータ、母平均や母分散など) の値を定めることである.

たとえば、ある集団の所得分布が対数正規分布に従うといっても、その平均、分散が知られていなければ、 現実の分析に用いることはできない.

「どの対数正規分布か」がわからないからである.

検定

因果推論

ベイズ統計学

推定するのは、母集団分布の母数 (パラメータ)のパラメータ

ベイズ推定

確率過程

その他

カーネル

参考

書籍

Web サイト

動画