オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【機械学習】データ拡張 / Data Augmentation #実装編 #01

Index

データ拡張 / Data Augmentation とは

データ拡張 / Data Augmentation とは、機械学習において、 学習用の画像データに対して「変換」を施すことでデータを水増しする手法.

Dataset

Dataset は、MNIST を利用.

環境とライブラリ

  • Google Colabratory (2022/02/14)
  • Python (3.7.12)

  • PyTorch (1.10.0)

  • Albumentations (1.0.0)
    • データ拡張のライブラリ

実装

データの確認

torchvision の datasets モジュールを使用して、DataLoader を作成する.

中身のデータを一応確認する.

TorchVision を利用

TorchVision の transforms を利用する.



反転が実行されているのが、わかる.

Albumentations を利用

データ拡張のライブラリ Albumentations を利用する.



回転とノイズの付与が実行されているのが、わかる.

参考

  • PyTorchでデータ水増し(Data Augmentation)する方法

  • Albumentations の公式ドキュメント