オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【機械学習】ブートストラップ法 / Bootstrap Method

Index

ブートストラップ法 / Bootstrap Method

機械学習におけるデータ分割の方法のひとつ.

再代入誤り率のバイアスを補正するために利用される.

データ集合  D とし、分割後の学習データ集合を  D_{train}、テストデータ集合を  D_{test} とする.
データ集合  D の件数 :  N

分割後の学習データ集合を  D_{train} の件数 :  N_{train}

分割後のテストデータ集合を  D_{test} の件数 :  N_{test}


再代入誤り率  \epsilon(N,\ N) を考える.

この誤識別率は、学習データと同じテストデータを用いているので、 真の誤識別率より、低く出るはずである.

この差をバイアスという.



このバイアスを  N 個のデータから  N 回復源抽出を行なって作ったブートストラップサンプルを用いて修正する.

参考