オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【機械学習】データ拡張 / Data Augmentation #まとめ編

Index

データ拡張 / Data Augmentation とは

データ拡張 / Data Augmentation とは、機械学習において、 学習用のデータに対して「変換」を施すことでデータを水増しする手法.

様々なデータに対するデータ拡張

画像

深層学習のCNN は、微小な平行移動や歪みに対する不変性をもつ一方で、
画像の回転、反転、輝度の変化に対する不変性を構造として持たない.

そのために、訓練画像に左右反転などの幾何学的変換を加えて、訓練データを拡張し、
この画像を学習させることで、不変性を学習させる.

また、画像を擬似的に大量に増やすので、過学習の防止に役立つ.

さらに、訓練データが少ないときにデータを擬似的に増やす方法として、
画像の各画素にガウスノイズを付加するという手法がある.



自然言語

マルチモーダル

研究

  • Steerable Equivariant Representation Learning

参考

Web サイト

  • データ拡張(Data Augmentation)徹底入門!Pythonとkerasでデータ拡張を実装しよう