オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】確率の加法定理

この記事の読者

統計学の基礎となる「確率の加法定理」について知りたい.



Index

加法定理

事象  A B とが背反事象、すなわち  A \cap B = \emptyset であるとする.

確率の公理によって、

 P(A \cup B) = P(A) + P(B) \tag{0}



となる.

これを加法定理と呼ぶ.

一般化

次に、事象AとBとは背反事象でなく、共通部分をもっている場合を考える.



 A \cup B A \cup \overline{B},\ \overline{A} \cup B,\ A \cup B の3つの事象の和事象であり、 これらの事象は互いに排反であるので

 P(A \cup B) = P(A \cup \overline{B}) + P(\overline{A} \cup B) + P(A \cup B) \tag{1}



が成立する.

さらに、

A = (A \cap \overline{B}) \cup (A \cap B) \tag{2.a}
B = (B \cap \overline{A}) \cup (B \cap A) \\
\ \ \ = (A \cap B) \cup (\overline{A} \cup B) \tag{3.a}



が成立し、左辺の各項は、排反事象であるので


P(A) = P(A \cap \overline{B}) + P(A \cap B) \tag{2.b}

P(B) = P(A \cap B) + P(\overline{A} \cup B) \tag{3.b}



が成立し、式 (2.b) と (3.b) 以下のように変換できる.


P(A \cap \overline{B}) = P(A) - P(A \cap B) \tag{2.c}

P(\overline{A} \cup B) = P(B) - P(A \cap B) \tag{3.c}



これを式 (1) に代入する.


P(A \cup B) \\
= P(A) - P(A \cap B) + P(B) - P(A \cap B) + P(A \cup B) \\
= P(A) + P(B) - P(A \cap B)



となる.

これが加法定理の一般的な形式.

 A B が排反事象の場合は  P(A \cap B) = 0 となるので、最初の式 (0) も成立する.

例1

さいころ投げにおいて、奇数の目が出る事象を  A、3以下の目が出る事象  B とする.

事象を集合で表現すると、


A = \{ 1, 3, 5 \} \\
B = \{ 1, 2, 3 \} \\
A \cap B = \{1, 3\}



各事象の確率は、


P(A) = \frac{3}{6} = \frac{1}{2} \\
P(B) = \frac{3}{6} = \frac{1}{2} \\
P(A \cap B) = \frac{2}{6} = \frac{1}{3}



P(A \cup B) の確率は以下のように計算できる.


P(A \cup B) \\
= P(A) + P(B) - P(A \cap B) \\
= \frac{1}{2} + \frac{1}{2} - \frac{1}{3}
= \frac{2}{3}



集合で考えれば、 P(A \cup B) = { 1, 2, 3, 5}となるので、直接計算もできるが、 本例は計算から求められるという内容になる.

例2

3つの問題  A,\ B,\ C からなるテスト問題がある.

それぞれの正解率は以下の通り.

A: 19%, B: 17%, C: 13%

AとBのどちらも正解: 6%, BとCのどちらも正解: 5%, CとAのどちらも正解: 5%

全問正解: 2%



そこで、「0点でない人」の確率を求める.

「0点でない人」はつまり、A, B, C のどれかを正解している人.



まず、3つ以上の事象の和事象についての一般化する.


P(A \cup B \cup C) \\
= P(A) + P(B) + P(C) \\
\ \ \ - P(A \cap B) - P(B \cap C) - P(A \cap C) \\
\ \ \ + P(A \cap B \cap C)



問題の条件を代入することで、解答を手に入れることができる.


P(A \cup B \cup C) \\
= 0.19 + 0.17 + 0.13 \\
- 0.06 - 0.05 - 0.05 + 0.02 \\
= 0.35

多次元化

同時確率

さきほどの A \cup B は、事象  A と事象  B の2つの事象のどちらかが発生しているしていることを表現している.

なので、 P(A \cup B) は2つの事象の和事象についての確率を考える.

以下のように表現する.

P(X=x_i, Y=y_j)



これは、確率変数  X,\ Y x_i, y_j をとる確率を上のように表現し、同時確率と呼ぶ.

また、前提として確率変数  X Y は互いに関連し合わないとする.

2つのサイコロ  X,\ Y があり、それぞれがある目を出す事象の確率を定義するようなイメージ.

つまり、サイコロ  X 1 を出し、 サイコロ  Y 6 を出す確率は  P(X=1, Y=6) のように表現できる.



そこで、この同時確率の表記で、加法定理を示す.

P(X=x_i) = \displaystyle \sum_{j=1}^{L} P(X=x_j, Y=y_j)



 L は 確率変数  Y が離散的に取り得る事象の数.

まとめ

  • 複数の事象の和事象の確率を計算する方法のひとつとして、加法定理を利用することができる
  • 同時確率を用いることで、別の事象との確率式への置き換えも可能

参考