オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】母集団と標本

Index

母集団と標本

我々が、これから知りたいと思う (データの) 集合全体を 母集団 (population) と呼ぶ.

しかし、その集合のデータをすべて知るには困難な場合がある.

その場合、以下の作業で代替する.

  1. 母集団からその一部 (標本 / Sample) を選び出す (標本抽出 / Sampling)
  2. 分析
  3. 母集団についての推定

ここで注意するべきは、直接調査するのは、標本であるが、知ろうとするのは、母集団の分布である.

我々の平均

我々が、普段計算する「平均」は手元の標本の平均であって、目的とする母集団の平均ではない.

我々の知りたいものは、母集団に関することが多い.

標本と母集団、どちらの「何か(平均とか分散とか)」を考えているのかを区別するべきである.

母集団と標本の間を取り持つのが、標本分布 である.

確率の前提

ここでは、推計的統計学 (統計的推測) における、「確率の公理主義的定義」を前提に考える.

分析対象とする母集団の属性について完全に知ることができる場合、 (例えば、学校のクラスでテストの平均を計算するときは、分析対象(母集団)が クラスの生徒に絞られる. つまり標本 = 母集団である.) この分布をわかりやすく要約、整理するために、「記述統計学」の確率が使われていた.

しかし、推計的統計学 (統計的推測) は、ある母集団について知りたいとき、 全体からではなく部分から推量 (推測・推定) する.

参考