Index
前処理
機械学習で利用されるデータの前処理について記す.
- 機械学習 分野一覧 #まとめ編
平均ベクトルと共分散行列
- 平均ベクトルと共分散行列
標準化 / Standardization
Min-Max スケーリング
対数スケーリング
絶対値スケーリング
Box-Cox 変換
Yeo-Johnson 変換
無相関化
- 無相関化
白色化 / Whitening
- 白色化 / Whitening
カテゴリカル変数
One-Hot Encoding
- One-Hot Encoding
get_dummies を使用.
Label Encoding
男 -> 0 / 女 -> 1 のような.
時系列解析
- 時系列解析における特有の前処理
参考
はじめてのパターン認識
- 4 確率モデルと識別関数
- 4.1 観測データの線形変換
- 4.1.1 平均ベクトルと共分散行列
- 4.1.2 観測データの標準化
- 4.1.3 観測データの無相関化
- 4.1.4 白色化
- 4.1 観測データの線形変換
-
- 4 確率モデルと識別関数
Kaggle で勝つデータ分析の技術
- 3 特徴量の作成
- 3.4 数値変数の変換
- 3.5 カテゴリ変数の変換
- 3.5.1 one-hot encoding
- 3.5.2 label encoding
- 3.5.3 feature hashing
- 3.5.4 frequency encoding
- 3.5.5 target encoding
- 3.5.3 embedding
- 3 特徴量の作成