- #まとめ編 一覧
Index
画像処理 / Image Processing
画像処理とは、画像を入力とし、それらに対して何らかの処理を施すこと.
狭義の画像処理
画像を処理した結果が、再び画像である場合、「狭義の画像処理」であると考える.
それに対し、入力された画像から、そこに写っている対象に対する何らかの情報を抽出し、 対象に関するある「記述」を得る場合で、「画像解析」、「画像計測」、「画像認識」などと呼ばれる.
画像認識 / Image Recognition
画像認識は、画像に写る内容を理解すること.
ここでの基本的な目的は、「画像認識」のような、画像から何らかの情報を抽出することを想定している.
画像について
我々は、画像から。何らかの情報を抽出することを目的としている.
そのために、我々は画像について知っておく必要がある.
画素 / pixel
画像は、多数の画素 / pixel で構成されている.
横に 個、縦に 個の画素で構成されているとき、
画像を構成している画素の個数は、 個である.
さらに、画素の値を画素値 / pixel value と呼ぶ.
グレースケール画像
画素値が、画像中の明るさだけを表す画像を、グレースケール画像と呼ぶ.
カラー画像
グレースケール画像に対して、赤 (R)・緑 (G) ・青 (B) の 3 つの原色を混合する量で、
あらゆる色の光を表すことができる.
画像中の位置に対応して、赤 (R)・緑 (G) ・青 (B) の 3 つの原色の量を (画素をベクトルとして) 持てば、
画像中のすべての位置でそれそれすべての色を表すことができるようになる.
このように、画像中の位置に対応した赤 (R)・緑 (G) ・青 (B) の 3 つの画素値をもつ画像を RGB カラー画像と呼ぶ.
表色系 / Color Specification System
色を定量的に表す体系を、表色系 / Color Specification System と呼ぶ.
- 顕色系 / Color Appearance System : 人間が知覚した色を記号や色票などで定性的に扱う
混色系 / Color Mixing System : 実験に基づいて色を心理物理量として定量的に扱う
- CIE-RGB 表色系
- CIE-XYZ 表色系
表色系 / Color Specification System
色空間
- CIE 均等色空間
- CIE Lab 色空間
- sRGB 色空間
HSI 空間 / HSI 変換
RGB カラー画像を構成する RGB 値を調整して、画像の明るさだけを変えたい場合、
RGB それぞれの値を少し大きくすれば、画像は明るくなるが、同時に色も濃くなってしまう.
そこで、RGB 値を調整して、画像の明るさは変えずに、彩度だけを高くするような画像処理を行いたいときは、
RGB 値をマンセル表色系に近い色相 (Hue)・彩度 (Saturation)・明度 (Intensity) の 3 つの値に変換し、
これらの値を調整したのち、再び RGB 値に戻せば良い.
色相 (Hue)・彩度 (Saturation)・明度 (Intensity) を座標軸とする空間を HSI 空間と呼ぶ.
RGB 空間から HSI 空間への変換を HSI 変換と呼ぶ.
- HSI 空間 / HSI 変換
前処理
何らかの情報を抽出するテクニックは、色々ある.
しかし、情報を抽出しやすくするために、その前に行う処理がある.
閾値処理
- 閾値処理
空間フィルタリング
- 空間フィルタリング
膨張処理 / 収縮処理
モルフォロジー変換
- モルフォロジー変換
基本手法
フーリエ変換 / Fourier Transform
Image Pyramid
局所特徴
局所特徴 / Local Feature とは、画像全体ではなく、
画像中の局所的な小領域を表現する特徴である.
下の例にて、ある物体 (左) をある画像内 (右) から探すことを考える.
ある物体の画像 (左) には、ある物体のみが写り、
探索の対象の画像 (右) には、複数の物体が写っている.
したがって、2 つの画像から抽出された大域特徴どうしを比較すると、大きく異なる.
しかし、局所領域内には、探索したい物体以外の物体の情報が、入っていないので、
2 つの画像の局所特徴を比較すると同じような値になる.
そのために、画像内から特定の物体を発見するには、大域特徴よりも、
局所特徴どうしの比較が有効である.
再現性
では、異なる画像から特定の物体を検出するという目的に用いるために、
局所特徴が満たすべき性質は何か?
同じ物体が写る 2 枚の画像が与えられたときに、各物体の同じ部分に同一の局所特徴
が検出される必要がある.
この性質のことを再現性 / Repeatabilityという.
再現性を満たすためには、ノイズやぶれなどに対しても、
検出結果や記述内容が変化しない頑健性 / Robustnessを持つ必要がある.
また、物体の変形や視点の変換で生じる、 平行移動、回転、スケール変換、アフィン変換などの影響を受けにくいことが望ましい.
局所特徴抽出の手法
局所特徴抽出は、画像の中の特徴点を捉える検出 / Detectionと、
特徴点のまわりの領域を表現する記述 / Descriptionで構成されている.
検出器 / Detector
記述子 / Descriptor
統計的特徴抽出
コーディング / Coding
局所特徴を認識に有効な次元数のベクトルに変換する操作を、
コーディング / Coding とよぶ.
データ の確率的統計的な構造から、
ノイズや外乱の影響の少ない 次元の低次元空間への写像 (線形写像)を求め、
この写像を用いて特徴抽出を行う過程が、統計的特徴抽出であった.
一方、コーディング / Coding は、分類に有利な 次元の 高次元空間への非線形な写像 を求め、この写像を用いて特徴 を求める過程のことである.
プーリング / Pooling
画像領域内に存在する複数のコーディング後の特徴ベクトルを 1 つのベクトルにまとめる操作を プーリング / Pooling という.
応用手法
Machine Learning
Context Clusters / CoCs / 2023
特徴量の抽出方法.
- Image as Set of Points
- [2023]
- openreview.net
- arxiv.org
自己教師あり学習 / Self Supervised Learning
- 自己教師あり学習 / Self Supervised Learning
Deep Learning
- DeepLearning を利用した手法
タスク
- 画像処理 タスク一覧
データセット
参考
書籍
ディジタル画像処理
- 1 イントロダクション
- 画像処理の位置づけと分類
- 2 ディジタル画像の撮影
- 2.4 画像のディジタル化
- 2.5 カラー画像
- 2.5.2 グレースケール画像とカラー画像
- 3 画像の性質と色空間
- 3.3 表色系と色空間
-
- 1 イントロダクション
画像認識
- 1 画像認識の概要
- 1.2 画像認識の分類
- 2 局所特徴
- 2.1 局所特徴とは
- 4 コーディングとプーリング
- 4.1 コーディングとプーリングの概要
- 4.1.1 コーディングとは
- 4.1.2 プーリングとは
- 4.1 コーディングとプーリングの概要
- 9 さらなる話題
- 9.1 セマンティックセグメンテーション
-
- 1 画像認識の概要
Python で学ぶ画像認識
Web サイト
- CV リファレンス マニュアル