オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】代表値とばらつき

Index

代表値とばらつき

分布を表現する数値として、分布の「代表値」と分布の「ばらつき」具合がある.

代表値

分布を代表する値を 代表値 (Averages) という.

代表値の長所は、計算したり、操作したり、誰かに伝えることができ、客観性があることである.

平均 / Mean

  • 算術平均 / Arithmetic Mean
  • 幾何平均 / Geometric Mean
  • 調和平均 / Harmonic Mean

算術平均 / Arithmetic Mean

 \bar{x}\ =\ \displaystyle \frac{x_{1}\ +\ x_{2}\ +\ \cdots\ +\ x_{n}}{n}

幾何平均 / Geometric Mean

 x_{G}\ =\ \sqrt[n]{x_{1}\ \cdot\ x_{2}\ \cdot\ \cdots\ \cdot\ x_{n}}

調和平均 / Harmonic Mean

 \displaystyle \frac{1}{x_{H}}\ =\ \displaystyle \frac{1}{n}\ (\ \displaystyle \frac{1}{x_{1}}\ +\ \displaystyle \frac{1}{x_{2}}\ 
+\ \cdots\ +\ \displaystyle \frac{1}{x_{n}}\ )

中央値 / Median

  • 分位点

最頻値 / Mode

ばらつき

分布の形状を表現するためには、代表値の他に「ばらつき」を利用する場合がある.

これは、観測点がどのように散らばっているかを示すもの.

範囲 / Range

分布の存在する範囲.

 R\ =\ max\{x_{1},\ x_{2},\ \cdots,\ x_{n}\}\ -\ min\{x_{1},\ x_{2},\ \cdots,\ x_{n}\}

偏差 / Deviation

観測値と平均との隔たりを考える.

  • 四分位偏差 / Quartile Deviation
  • 平均偏差 / Mean Deviation
  • 分散 / Variance
  • 標準偏差 / Standard. Deviation

四分位偏差 / Quartile Deviation

データの第3四分位点  Q_{3} と第3四分位点  Q_{1} の隔たりの半分.

平均偏差 / Mean Deviation

各観測点が平均からどれだけ離れているかについての平均を求める.

 d\ =\ \displaystyle \frac{1}{n}\ \{|x_{1}\ -\ \bar{x}|\ +\ |x_{2}\ -\ \bar{x}|\ +\ \cdots\ +\ |x_{n}\ -\ \bar{x}| \}

分散 / Variance と 標準偏差 / Standard. Deviation

偏差を絶対値ではなく、二乗することで符号を消し、同様に平均を求めたものを データの分散 / Varianceという.

 S^{2}\ =\ \displaystyle \frac{1}{n}\ \{(x_{1}\ -\ \bar{x})^{2}\ +\ (x_{2}\ -\ \bar{x})^{2}\ +\ \cdots\ +\ (x_{n}\ -\ \bar{x})^{2} \}



分散は測定単位が変わるので、平方根を取った  S が用いられる.



これを標準偏差 / Standard. Deviation と呼ぶ.

その他

参考

書籍

Web サイト