オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】確率変数と確率分布

  • こんな方におすすめ

    統計学機械学習でも必要な「確率変数」と「確率分布」の基本的な内容について知りたい。



この記事では、確率の基礎概念のまとめを行います。

「これから、機械学習ディープラーニングの学習をしたいから、その基本となる確率の理解を深めたい」という方に向けた記事になります。



  • キーワード・知ってると理解がしやすい
    • 確率

目次

確率変数とは

確率的に変動する変数。
さらにいうと、とる値に対してそれぞれ確率が与えられている変数。
(あくまで、変数ですね)

よく例として使われるのは、サイコロなのでサイコロを考えます。
しかし、このサイコロには細工がされていて、通常のサイコロと出る確率は異なります。



1 2 3 4 5 6
確率 1/12 2/12 3/12 3/12 2/12 1/12



表記

上の例を使って表記方法を記します。

例で、確率が与えられている値はサイコロの目になるので、
確率変数はサイコロの目になります。(1 ~ 6)

サイコロの目を確率変数 X とおきます。(確率変数は大文字を使うことが多いそう)
X=1のときの確率は以下のように表記します。


\displaystyle{
P(X=1)\ =\ \frac{1}{6}
}



確率変数は2つの条件を持っています。
(逆に言えば、この条件を満たしていない場合、確率変数とは言えないのですね)

  1. すべての確率変数の各確率は 0 以上 (p \ge 0)
  2. すべての確率変数の各確率の合計は 1 になる ( p_1\ +\ p_2\ +\ \cdots\ +\ p_6\ =\ 1)

確率分布とは

各確率変数の各確率のことを確率分布といいます。

表記

例の確率分布を定式化する前に、例のサイコロの確率分布をグラフで表現します。





サイコロの目の確率分布を可視化したところで定式化します。


P(X\ =\ x_{k})\ =\ f(x_{k})\ =
  \left\{
    \begin{array}{l}
      \frac{1}{12}\ (x_{k}=1のとき) \\
      \frac{2}{12}\ (x_{k}=2のとき) \\
      \frac{3}{12}\ (x_{k}=3のとき) \\
      \frac{3}{12}\ (x_{k}=4のとき) \\
      \frac{2}{12}\ (x_{k}=5のとき) \\
      \frac{1}{12}\ (x_{k}=6のとき)
    \end{array}
  \right.



それぞれの値の確率が、確率変数 X の確率分布となります。

離散型と連続型

確率分布は2種類あります。
確率変数が離散値の場合、その確率分布は離散型となり、
確率変数が連続値の場合、その確率分布は連続型となります。

確率密度関数と累積分布関数

確率変数と確率分布について書いたので、「確率密度関数」と「積分布関数」についても記述します。

確率密度関数は上式では関数 f をさします。

ここで、先ほどの確率分布を考えます。
サイコロを振って、「2」~「4」がでる確率は、


\ \ \ \ \ P(X=2) + P(X=3) + P(X=4) \\
=\ f(2)\ +\ f(3)\ +\ f(4) \\
=\ \frac{2}{12}\ +\ \frac{3}{12}\ +\ \frac{3}{12}\ =\ \frac{8}{12}

となります。

ここで、上式はこのようにも書けます。


P(2 \leq X \leq 4)\ =\ \displaystyle \sum_{n=2}^{4}\ f(n)

このように確率密度関数を足し合わせた(累積)関数を積分布関数といい、以下のように定式化します。


F(x)\ =\ P(X \leq x)

まとめ

  • 確率変数 : 確率的に変動する変数
  • 確率分布 : 確率変数の各確率
  • 確率密度関数 : 確率変数 の確率を表現した関数
  • 積分布関数 : 確率密度関数を足し合わせた(累積)関数

参考

  • 統計学入門 / 5.1 確率変数と確率分布

統計学入門 (基礎統計学Ⅰ)

統計学入門 (基礎統計学Ⅰ)

  • 発売日: 1991/07/09
  • メディア: 単行本