この記事の読者
キーワード・知ってると理解がしやすい
- 事象
- 場合の数、順列、組み合わせ
- 極限
測度論
統計学 #まとめ編
Index
確率の定義
確率とは、事象の起こりやすさを定量的に示すもので、
事象 のおこる確率を Probability の頭文字をとって で表す.
確率とは、どのようなものであるかという点について3つ (4つ) の立場の定義を記す.
ラプラスの定義
初期の確率論はさいころ、カードなどを使った賭けのゲームや保険といったものと関連して発生し、パスカル・ベルヌーイ・ベイズなどの多くの学者の
手によって発展したが、これらはラプラス (1749 ~ 1827) によってまとめられた.
ラプラスによる確率の定義は単純明快であり、
というもの.
この定義の最大の利点は、確率が標本の個数、つまり、起こり方の場合の数の数え上げに帰することであり、
順列、組み合わせの諸定理が使えること.
ここで問題となるのは、各標本 (観測されたデータ) 点が「同程度に確からしく」起ると仮定していること.
しかしながら、さいころとはそうゆうものであるからという理由で、われわれは1 ~ 6 までの目が同程度の確かさで、出現すると信じるしかない.
これを、一般に理由不十分の原則という.
頻度主義の定義
ラプラスの定義は、さいころやカードを使ったゲームやくじ引きといったものに対しては有益であるが、
各標本点が「同程度に確からしく」起りやすいと考えられない場合には用いることができない.
これより実際的な定義が、頻度による確率の定義、確率の頻度説である.
さいころを何百回も投げ、 が出た回数(頻度)を数えて、その割合(相対頻度)を記録するという実験をを考える.
となることが予想される.
このように、一般に事象 を生み得る実験を 回繰返して が 回出るとすると、 のとき、
となるならば、 と定義される.
相対頻度 の極限による確率のこの定義が、確率の頻度説である.
極限への収束は無限に試行を続けてはじめて確認されるものであるからだ.
また、仮にそれが可能としても、実験を行うごとに値 が同じという保証はない.
したがって、頻度説も理論上の仮定の上に成り立っている.
確率の公理主義的定義
上の2つの定義にはそれぞれ理論的に不完全な部分があるため、いずれも、理論的に完全ではない.
数学者 コルモゴフ の確率の公理主義的定義は、「確率」を公理として定義することにより、上のような困難を避けることに成功した.
- すべての事象 A に対して
- 互いに排反は事象 に対して、
この公理は、あくまでも数学的なモデルのためのものであるが、この公理とそれに基づく確率論は
ラプラスの定義や頻度的確率の性質などがその背景になっており、これらを体系的に表すことを目的としている.
(特に最後の項目は、「確率」がある特別の種類の測度であることを要請したもの.)
- 確率空間
- 集合体 / 可測空間
- 確率測度 / 確率空間
- yhayato1320.hatenablog.com
ベイズ主義の定義 (主観確率 / ベイズ確率)
「ラプラスの定義」や「頻度主義の定義」では、
- ある事象 A の起る確率 P(A) を同程度の確かさで起ると仮定したり
- 生起回数の相対頻度から求めたり
としていたが、これは誰が計算しても同一の値であり、客観的に決定される.
これを客観説の立場と呼ぶ.
これに対して、研究者が主観的にある確率を与えて分析を行う方法がある.
この方法では与えられる確率は研究者の得られる情報、知識、経験などによって異なる可能性があり、
主観確率と呼ばれる.
パターン認識 / 機械学習における確率論
パターン認識の分野における重要な概念は不確実性である.
これは計測ノイズやデータ集合のサイズが有限であることによって起きる.
確率論は不確実性に関する定量化と操作に関して一貫した枠組みを与え、パターン認識の基礎の中心を担っている.
また、決定理論と組み合わせることにより与えられた情報が不完全で曖昧なものであっても、 そのすべての情報の下で最適な予測をすることが可能になる.
統計学の分類
まとめ
- 確率は大きく分けると2種類の考え方がある
- 頻度主義
- ベイズ主義
- それぞれの考え方は、統計解析をする場面で適用方法を分けて利用することで、利用シーンが広がる
参考
確率・統計 Ⅰ
- 1 確率の基礎
- 1.1 事象と標本空間
- 1.2 確率の定義
- 1.3 順列の数と組合せの数
-
- 1 確率の基礎
-
- 1 序論
- 1.2 確率論
- 1.2.3 ベイズ確率
- 1.2 確率論
- 1 序論