オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】分野一覧 #まとめ編

Index

画像処理 / Image Processing

画像処理とは、画像を入力とし、それらに対して何らかの処理を施すこと.

狭義の画像処理

画像を処理した結果が、再び画像である場合、「狭義の画像処理」であると考える.

それに対し、入力された画像から、そこに写っている対象に対する何らかの情報を抽出し、 対象に関するある「記述」を得る場合で、「画像解析」、「画像計測」、「画像認識」などと呼ばれる.

画像認識 / Image Recognition

画像認識は、画像に写る内容を理解すること.



ここでの基本的な目的は、「画像認識」のような、画像から何らかの情報を抽出することを想定している.

画像について

我々は、画像から。何らかの情報を抽出することを目的としている.

そのために、我々は画像について知っておく必要がある.

画素 / pixel

画像は、多数の画素 / pixel で構成されている.

横に  M 個、縦に  N 個の画素で構成されているとき、 画像を構成している画素の個数は、 M\ \times\ N 個である.

さらに、画素の値を画素値 / pixel value と呼ぶ.

グレースケール画像

画素値が、画像中の明るさだけを表す画像を、グレースケール画像と呼ぶ.

カラー画像

グレースケール画像に対して、赤 (R)・緑 (G) ・青 (B) の 3 つの原色を混合する量で、 あらゆる色の光を表すことができる.

画像中の位置に対応して、赤 (R)・緑 (G) ・青 (B) の 3 つの原色の量を (画素をベクトルとして) 持てば、 画像中のすべての位置でそれそれすべての色を表すことができるようになる.

このように、画像中の位置に対応した赤 (R)・緑 (G) ・青 (B) の 3 つの画素値をもつ画像を RGB カラー画像と呼ぶ.

表色系 / Color Specification System

色を定量的に表す体系を、表色系 / Color Specification System と呼ぶ.

  • 顕色系 / Color Appearance System : 人間が知覚した色を記号や色票などで定性的に扱う
  • 混色系 / Color Mixing System : 実験に基づいて色を心理物理量として定量的に扱う

    • CIE-RGB 表色系
    • CIE-XYZ 表色系

  • 表色系 / Color Specification System

色空間

  • CIE 均等色空間
    • CIE Lab 色空間
  • sRGB 色空間

HSI 空間 / HSI 変換

RGB カラー画像を構成する RGB 値を調整して、画像の明るさだけを変えたい場合、 RGB それぞれの値を少し大きくすれば、画像は明るくなるが、同時に色も濃くなってしまう.

そこで、RGB 値を調整して、画像の明るさは変えずに、彩度だけを高くするような画像処理を行いたいときは、 RGB 値をマンセル表色系に近い色相 (Hue)・彩度 (Saturation)・明度 (Intensity) の 3 つの値に変換し、 これらの値を調整したのち、再び RGB 値に戻せば良い.

色相 (Hue)・彩度 (Saturation)・明度 (Intensity) を座標軸とする空間を HSI 空間と呼ぶ.

RGB 空間から HSI 空間への変換を HSI 変換と呼ぶ.

前処理

何らかの情報を抽出するテクニックは、色々ある.

しかし、情報を抽出しやすくするために、その前に行う処理がある.

閾値処理

空間フィルタリング

膨張処理 / 収縮処理

モルフォロジー変換

基本手法

局所特徴

局所特徴 / Local Feature とは、画像全体ではなく、 画像中の局所的な小領域を表現する特徴である.

一方、画像全体を表現する特徴を大域特徴 / Glogal Feature をいう.


下の例にて、ある物体 (左) をある画像内 (右) から探すことを考える.



ある物体の画像 (左) には、ある物体のみが写り、 探索の対象の画像 (右) には、複数の物体が写っている.



したがって、2 つの画像から抽出された大域特徴どうしを比較すると、大きく異なる.

しかし、局所領域内には、探索したい物体以外の物体の情報が、入っていないので、 2 つの画像の局所特徴を比較すると同じような値になる.

そのために、画像内から特定の物体を発見するには、大域特徴よりも、 局所特徴うしの比較が有効である.

再現性

では、異なる画像から特定の物体を検出するという目的に用いるために、 局所特徴が満たすべき性質は何か?

同じ物体が写る 2 枚の画像が与えられたときに、各物体の同じ部分に同一の局所特徴 が検出される必要がある.

この性質のことを再現性 / Repeatabilityという.

再現性を満たすためには、ノイズぶれなどに対しても、 検出結果や記述内容が変化しない頑健性 / Robustnessを持つ必要がある.

また、物体の変形視点の変換で生じる、 平行移動、回転、スケール変換、アフィン変換などの影響を受けにくいことが望ましい.

局所特徴抽出の手法

局所特徴抽出は、画像の中の特徴点を捉える検出 / Detectionと、 特徴点のまわりの領域を表現する記述 / Descriptionで構成されている.

統計的特徴抽出

コーディング / Coding

局所特徴を認識に有効な次元数のベクトルに変換する操作を、 コーディング / Coding とよぶ.

データ  x\ \in R^{D}確率的統計的な構造から、 ノイズや外乱の影響の少ない  D_{s}\ (\leq D) 次元の低次元空間への写像 (線形写像)を求め、 この写像を用いて特徴抽出を行う過程が、統計的特徴抽出であった.

一方、コーディング / Coding は、分類に有利な  D_{c}\ (\geq D) 次元の 高次元空間への非線形写像  g を求め、この写像を用いて特徴  c を求める過程のことである.

プーリング / Pooling

画像領域内に存在する複数のコーディング後の特徴ベクトルを 1 つのベクトルにまとめる操作を プーリング / Pooling という.

応用手法

Machine Learning

Context Clusters / CoCs / 2023

特徴量の抽出方法.

自己教師あり学習 / Self Supervised Learning

Deep Learning

タスク

データセット

参考

書籍

Web サイト

  • CV リファレンス マニュアル