オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【機械学習】前処理 #まとめ編 #01

Index

前処理

機械学習で利用されるデータの前処理について記す.

平均ベクトルと共分散行列

標準化 / Standardization

Min-Max スケーリング

対数スケーリング

 \log(x),\ \log(x\ +\ 1)

絶対値スケーリング

Box-Cox 変換

Yeo-Johnson 変換

無相関化

  • 無相関化

白色化 / Whitening

  • 白色化 / Whitening

カテゴリカル変数

One-Hot Encoding

get_dummies を使用.

Label Encoding

男 -> 0 / 女 -> 1 のような.

時系列解析

参考