#まとめ編一覧
- yhayato1320.hatenablog.com

Index

Index
画像処理 / Image Processing
- 狭義の画像処理
- 画像認識 / Image Recognition
画像について
前処理
基本手法
応用手法
- Machine Learning
タスク
データセット
参考
- 書籍
- Web サイト

画像処理 / Image Processing

画像処理とは、画像を入力とし、それらに対して何らかの処理を施すこと.

狭義の画像処理

画像を処理した結果が、再び画像である場合、「狭義の画像処理」であると考える.

それに対し、入力された画像から、そこに写っている対象に対する何らかの情報を抽出し、対象に関するある「記述」を得る場合で、「画像解析」、「画像計測」、「画像認識」などと呼ばれる.

画像認識 / Image Recognition

画像認識は、画像に写る内容を理解すること.

ここでの基本的な目的は、「画像認識」のような、画像から何らかの情報を抽出することを想定している.

画像について

我々は、画像から。何らかの情報を抽出することを目的としている.

そのために、我々は画像について知っておく必要がある.

画素 / pixel

画像は、多数の画素 / pixel で構成されている.

横に $M$ 個、縦に $N$ 個の画素で構成されているとき、画像を構成している画素の個数は、 $M\ \times\ N$ 個である.

さらに、画素の値を画素値 / pixel value と呼ぶ.

グレースケール画像

画素値が、画像中の明るさだけを表す画像を、グレースケール画像と呼ぶ.

カラー画像

グレースケール画像に対して、赤 (R)・緑 (G) ・青 (B) の 3 つの原色を混合する量で、あらゆる色の光を表すことができる.

画像中の位置に対応して、赤 (R)・緑 (G) ・青 (B) の 3 つの原色の量を (画素をベクトルとして) 持てば、画像中のすべての位置でそれそれすべての色を表すことができるようになる.

このように、画像中の位置に対応した赤 (R)・緑 (G) ・青 (B) の 3 つの画素値をもつ画像を RGB カラー画像と呼ぶ.

表色系 / Color Specification System

色を定量的に表す体系を、表色系 / Color Specification System と呼ぶ.

顕色系 / Color Appearance System : 人間が知覚した色を記号や色票などで定性的に扱う
- マンセル表色系
混色系 / Color Mixing System : 実験に基づいて色を心理物理量として定量的に扱う
- CIE-RGB 表色系
- CIE-XYZ 表色系
表色系 / Color Specification System
- yhayato1320.hatenablog.com

色空間

CIE 均等色空間
- CIE Lab 色空間
sRGB 色空間

HSI 空間 / HSI 変換

RGB カラー画像を構成する RGB 値を調整して、画像の明るさだけを変えたい場合、 RGB それぞれの値を少し大きくすれば、画像は明るくなるが、同時に色も濃くなってしまう.

そこで、RGB 値を調整して、画像の明るさは変えずに、彩度だけを高くするような画像処理を行いたいときは、 RGB 値をマンセル表色系に近い色相 (Hue)・彩度 (Saturation)・明度 (Intensity) の 3 つの値に変換し、これらの値を調整したのち、再び RGB 値に戻せば良い.

色相 (Hue)・彩度 (Saturation)・明度 (Intensity) を座標軸とする空間を HSI 空間と呼ぶ.

RGB 空間から HSI 空間への変換を HSI 変換と呼ぶ.

HSI 空間 / HSI 変換
- yhayato1320.hatenablog.com

前処理

何らかの情報を抽出するテクニックは、色々ある.

しかし、情報を抽出しやすくするために、その前に行う処理がある.

閾値処理

閾値処理
- 二値化処理
- yhayato1320.hatenablog.com

空間フィルタリング

空間フィルタリング
- yhayato1320.hatenablog.com

膨張処理 / 収縮処理

モルフォロジー変換

モルフォロジー変換
- labs.eecs.tottori-u.ac.jp

基本手法

フーリエ変換 / Fourier Transform
- yhayato1320.hatenablog.com
Image Pyramid
- yhayato1320.hatenablog.com

局所特徴

局所特徴 / Local Feature とは、画像全体ではなく、画像中の局所的な小領域を表現する特徴である.

一方、画像全体を表現する特徴を大域特徴 / Glogal Feature をいう.

下の例にて、ある物体 (左) をある画像内 (右) から探すことを考える.

ある物体の画像 (左) には、ある物体のみが写り、探索の対象の画像 (右) には、複数の物体が写っている.

したがって、2 つの画像から抽出された大域特徴どうしを比較すると、大きく異なる.

しかし、局所領域内には、探索したい物体以外の物体の情報が、入っていないので、 2 つの画像の局所特徴を比較すると同じような値になる.

そのために、画像内から特定の物体を発見するには、大域特徴よりも、 局所特徴どうしの比較が有効である.

再現性

では、異なる画像から特定の物体を検出するという目的に用いるために、局所特徴が満たすべき性質は何か?

同じ物体が写る 2 枚の画像が与えられたときに、各物体の同じ部分に同一の局所特徴 が検出される必要がある.

この性質のことを再現性 / Repeatabilityという.

再現性を満たすためには、ノイズやぶれなどに対しても、検出結果や記述内容が変化しない頑健性 / Robustnessを持つ必要がある.

また、物体の変形や視点の変換で生じる、 平行移動、回転、スケール変換、アフィン変換などの影響を受けにくいことが望ましい.

局所特徴抽出の手法

局所特徴抽出は、画像の中の特徴点を捉える検出 / Detectionと、特徴点のまわりの領域を表現する記述 / Descriptionで構成されている.

検出器 / Detector
- yhayato1320.hatenablog.com
記述子 / Descriptor
- yhayato1320.hatenablog.com

統計的特徴抽出

コーディング / Coding

局所特徴を認識に有効な次元数のベクトルに変換する操作を、 コーディング / Coding とよぶ.

データ $x\ \in R^{D}$ の確率的統計的な構造から、ノイズや外乱の影響の少ない $D_{s}\ (\leq D)$ 次元の低次元空間への写像 (線形写像)を求め、この写像を用いて特徴抽出を行う過程が、統計的特徴抽出であった.

一方、コーディング / Coding は、分類に有利な $D_{c}\ (\geq D)$ 次元の 高次元空間への非線形な写像 $g$ を求め、この写像を用いて特徴 $c$ を求める過程のことである.

プーリング / Pooling

画像領域内に存在する複数のコーディング後の特徴ベクトルを 1 つのベクトルにまとめる操作を プーリング / Pooling という.

応用手法

Machine Learning

Context Clusters / CoCs / 2023

特徴量の抽出方法.

Image as Set of Points
- [2023]
- openreview.net
- arxiv.org

自己教師あり学習 / Self Supervised Learning

自己教師あり学習 / Self Supervised Learning
- yhayato1320.hatenablog.com

Deep Learning

DeepLearning を利用した手法
- yhayato1320.hatenablog.com

タスク

画像処理タスク一覧
- yhayato1320.hatenablog.com

データセット

画像データセット
- yhayato1320.hatenablog.com

参考

書籍

ディジタル画像処理
- 1 イントロダクション
  - 画像処理の位置づけと分類
- 2 ディジタル画像の撮影
  - 2.4 画像のディジタル化
  - 2.5 カラー画像
    - 2.5.2 グレースケール画像とカラー画像
- 3 画像の性質と色空間
  - 3.3 表色系と色空間
- ディジタル画像処理 [改訂第二版]
  - 公益財団法人画像情報教育振興協会（CG-ARTS協会）
  Amazon
画像認識
- 1 画像認識の概要
  - 1.2 画像認識の分類
- 2 局所特徴
  - 2.1 局所特徴とは
- 4 コーディングとプーリング
  - 4.1 コーディングとプーリングの概要
    - 4.1.1 コーディングとは
    - 4.1.2 プーリングとは
- 9 さらなる話題
  - 9.1 セマンティックセグメンテーション
- 画像認識 (機械学習プロフェッショナルシリーズ)
  - 作者:原田達也
  - 講談社
  Amazon
Python で学ぶ画像認識
- Pythonで学ぶ画像認識機械学習実践シリーズ
  - 作者:田村雅人,中村克行
  - インプレス
  Amazon

Web サイト

CV リファレンスマニュアル
- opencv.jp

オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【画像処理】分野一覧 #まとめ編