オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】データ拡張 / Data Augmentation #まとめ編

Index

データ拡張 / Data Augmentation

データ拡張 / Data Augmentation とは、機械学習において、 学習用のデータに対して「変換」を施すことでデータを水増しする手法.

ここでは、画像データにおける Data Augmentation について、記す.

画像における Data Augmentation

深層学習のCNN は、微小な平行移動や歪みに対する不変性をもつ一方で、
画像の回転、反転、輝度の変化に対する不変性を構造として持たない.

そのために、訓練画像に左右反転などの幾何学的変換を加えて、訓練データを拡張し、
この画像を学習させることで、不変性を学習させる.

また、画像を擬似的に大量に増やすので、過学習の防止に役立つ.

さらに、訓練データが少ないときにデータを擬似的に増やす方法として、
画像の各画素にガウスノイズを付加するという手法がある.

Data Augmentation の手法

画像処理による Data Augmentation

  • Random Cropping / 切り取り
  • Resizing / アスペクト (縦横比) の変換
  • Scaling
  • Rotation / 回転
  • Noise Injection / ノイズの追加
  • Image Mixing / 画像同士の合成
    • Mixup
    • CutMix




  • GradientBased Learning Applied to Document Recognition
    • [1998]
    • 1 Introduction
      • 1.1 Learning from Data
      • 1.2 Gradient-Based Learning
      • 1.3 Gradient Back-Propagation
      • 1.4 Learning in Real Handwriting Recognition Systems
      • 1.5 Globally Trainable Systems
    • 2 Convolutional Neural Networks for Isolated Character Recognition
      • 2.1 Convolutional Networks
    • 3 Results and Comparison with Other Methods
      • 3.5 Invariance and Noise Resistance
        • Noise Injection
    • http://vision.stanford.edu/cs598_spring07/papers/Lecun98.pdf

Mixup / 2017

  • mixup: Beyond Empirical Risk Minimization

Cutout / 2017

  • Improved Regularization of Convolutional Neural Networks with Cutout

SamplePairing / 2018

  • Data Augmentation by Pairing Samples for Images Classification

CutMix / 2019



AugMix / 2019

  • AugMix: A Simple Data Processing Method to Improve Robustness and Uncertainty

  • シンプルだけど最強!?モデルの汎化性と不確実性両方を改善するデータ拡張手法AugMix登場!

深層学習を用いた Data Augmentation

GAN を利用した Data Augmentation

  • The Effectiveness of Data Augmentation in Image Classification using Deep Learning

  • Data Augmentation in Emotion Classification Using Generative Adversarial Networks

  • GAN Augmentation: Augmenting Training Data using Generative Adversarial Networks

  • ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness

  • Style Augmentation: Data Augmentation via Style Randomization

  • STaDA: Style Transfer as Data Augmentation

Teach Augment / 2022

  • TeachAugment: Data Augmentation Optimization Using Teacher Knowledge

  • Teach Augment:教師モデル活用によるデータ拡張の最適化

Style Transfer を利用した Data Augmentation

  • Exploring the structure of a real-time, arbitrary neural artistic stylization network

Image Synthesis を利用した Data Augmentation

  • Semantic Image Synthesis with Spatially-Adaptive Normalization

参考

Web サイト