オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】確率変数と確率分布

Index

確率変数とは

確率的に変動する変数.

さらにいうと、とる値に対してそれぞれ確率が与えられている変数.

よく例として使われるのは、サイコロなのでサイコロを考える.

しかし、このサイコロには細工がされていて、通常のサイコロと出る確率は異なる.

1 2 3 4 5 6
確率 1/12 2/12 3/12 3/12 2/12 1/12

表記

上の例を使って表記方法を記す.

例で、確率が与えられている値はサイコロの目になるので、 確率変数はサイコロの目になる. (1 ~ 6)

サイコロの目を確率変数 X とおく.(確率変数は大文字を使うことが多い.)

X=1のときの確率は以下のように表記す.

\displaystyle{P(X=1)\ =\ \frac{1}{6}}



確率変数は2つの条件を持っている.

(逆に言えば、この条件を満たしていない場合、確率変数とは言えない.)

  1. すべての確率変数の各確率は 0 以上 (p \ge 0)
  2. すべての確率変数の各確率の合計は 1 になる ( p_1\ +\ p_2\ +\ \cdots\ +\ p_6\ =\ 1)

確率分布とは

各確率変数の各確率のことを確率分布という.

表記

例の確率分布を定式化する前に、例のサイコロの確率分布をグラフで表現する.



サイコロの目の確率分布を可視化したところで定式化する.


P(X\ =\ x_{k})\ =\ f(x_{k})\ =
  \left\{
    \begin{array}{l}
      \frac{1}{12}\ (x_{k}=1のとき) \\
      \frac{2}{12}\ (x_{k}=2のとき) \\
      \frac{3}{12}\ (x_{k}=3のとき) \\
      \frac{3}{12}\ (x_{k}=4のとき) \\
      \frac{2}{12}\ (x_{k}=5のとき) \\
      \frac{1}{12}\ (x_{k}=6のとき)
    \end{array}
  \right.



それぞれの値の確率が、確率変数 X の確率分布となる.

離散型と連続型

確率分布は2種類ある.

確率変数が離散値の場合、その確率分布は離散型となり、 確率変数が連続値の場合、その確率分布は連続型となる.

確率密度関数と累積分布関数

確率変数と確率分布について書いたので、「確率密度関数」と「積分布関数」についても記述する.

確率密度関数

確率密度関数は上式では関数 f をさす.

 P(x\ =\ x_{k})\ =\ f(x_{k})



確率密度間数は、以下の条件を満たす.

離散型の場合

  1.  f(x_{i})\ \geq\ 0\ (k\ =\ 1,\ \cdots)
  2.  \displaystyle \sum_{k\ =\ 1}^{\infty} f(x_{k})


連続型の場合

  1.  \forall x\ \in\ X に対し、 f(x_{i})\ \geq\ 0
  2.  \displaystyle \int_{-\ \infty}^{\infty} f(x_{k})

積分布関数

ここで、先ほどの確率分布を考える.

サイコロを振って、「2」~「4」がでる確率は、


\ \ \ \ \ P(X=2) + P(X=3) + P(X=4) \\
=\ f(2)\ +\ f(3)\ +\ f(4) \\
=\ \frac{2}{12}\ +\ \frac{3}{12}\ +\ \frac{3}{12}\ =\ \frac{8}{12}



となる.

ここで、上式はこのようにも書ける.

P(2 \leq X \leq 4)\ =\ \displaystyle \sum_{n=2}^{4}\ f(n)



このように確率密度関数を足し合わせた(累積)関数を積分布関数といい、以下のように定式化する.

F(x)\ =\ P(X \leq x)

まとめ

  • 確率変数 : 確率的に変動する変数
  • 確率分布 : 確率変数の各確率
  • 確率密度関数 : 確率変数 の確率を表現した関数
  • 積分布関数 : 確率密度関数を足し合わせた(累積)関数

参考

Web サイト