Index
ブートストラップ法 / Bootstrap Method
機械学習におけるデータ分割の方法のひとつ.
再代入誤り率のバイアスを補正するために利用される.
データ集合 とし、分割後の学習データ集合を 、テストデータ集合を とする.
再代入誤り率 を考える.
この誤識別率は、学習データと同じテストデータを用いているので、 真の誤識別率より、低く出るはずである.
この差をバイアスという.
データ集合 の件数 :
分割後の学習データ集合を の件数 :
分割後のテストデータ集合を の件数 :
分割後の学習データ集合を の件数 :
分割後のテストデータ集合を の件数 :
再代入誤り率 を考える.
この誤識別率は、学習データと同じテストデータを用いているので、 真の誤識別率より、低く出るはずである.
この差をバイアスという.
このバイアスを 個のデータから 回復源抽出を行なって作ったブートストラップサンプルを用いて修正する.
参考
- はじめてのパターン認識
- 2 識別規則と学習法の概要
- 2.2 汎化能力
- 2.2.1 学習データとテストデータの作り方
- 2.2 汎化能力
- 2 識別規則と学習法の概要