オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】アルゴリズム #まとめ編

Index

深層学習を用いた画像処理

深層学習を用いた画像処理のアルゴリズムをまとめる.

Network Architecture

CNN

Attention

Transformer

CXV / Convolutional Xformers for Vision / 2022

画像処理に特化した新しいハイブリッドニューラルネットワークアーキテクチャ. このモデルは、従来の Transformer の計算コストとデータ要件を軽減するために、畳み込み層と線形 Attention 機構を組み合わせることで、少ないデータとGPUリソースで高い画像分類精度を実現. さらに、訓練プロセスの後半でオプティマイザーを切り替えることで精度を向上させる、新しい訓練戦略「DualOpT」も提案されている.



工夫・テクニック

Data Augmentation

Diffusion Model

LZU / 2023

Visual Atoms / 2023

輪郭が重要という仮説に基づき正弦波により多様な輪郭を描画してFDSL事前学習を強化.

一般画像認識タスク(ImageNet-1k)にてJFT-300M事前学習の精度84.2%に迫る83.7%を約14分の1のデータセットサイズで達成.



参考