- #まとめ編 一覧
Index
- Index
- 画像処理のタスク
- 3D
- マルチモーダルタスク
- 参考
画像処理のタスク
画像処理におけるタスクをまとめる.
画像処理 分野一覧 #まとめ編
タスク一覧 #まとめ編
特徴領域の検出
Edge Detection
- Edge Detection
Line Detection
- Line Detection
Contours / Rect / Box Detection
- Contours / Rect / Box Detection
画像認識 / Image Recognition
画像認識 / Image Recognition とは、画像に写る内容を理解することである.
画像認識で扱うトピックは多岐にわたり、認識する目的に応じて細分化されている.
様々な分類方法があるが、
画像からシンボルに変換する画像認識を考えると、
物体認識 / Object Recognition とシーン認識 / Scene Recognitionに分類できる.
物体認識 / Object Recognition
物体認識とは、入力画像に写る物体を理解し、適切なラベルを付与する過程を指す.
- 物体認識 / Object Recognition #まとめ編
シーン認識 / Scene Recognition
一方、シーンは、実世界の環境であり、複数の物体などが存在し、なんらかの意味をなす状況を表現したものと捉える.
つまり、シーン認識とは、画像が表現する包括的な情報を理解する過程のこと.
物体検出 / Object Detection
画像から物体のクラスを予測するだけでなく、物体が存在する領域まで、
推定することを物体検出 / Object Detectionという.
物体検出は、対象物体を囲む四角い領域 (Bounding Box)を推定する.
- 物体検出 / Object Detection #まとめ編
Human Detection
特定の物体の中でも、人間の検出に焦点を当てたタスク.
- Human Detection
Person Re-Identification
異なるカメラ、もしくは同じカメラで異なる機会に撮影された
同一人物に関する再識別 / 再特定をするタスク.
- Person Re-Identification
Person Search
複数のシーンの画像の中から特定の人間を検出するタスク.
Human (Person) Detection + Person Re-Identification
- Person Search
Keypoint Detection
ある特定の物体 (主に人間) を検出し、
(主に人間の人体に関する) 部分的な位置を特定するタスク.
Pose Estimation と同様に扱われることが多い.
- Keypoint Detection / Pose Estimation
Pose Estimation
ある特定の物体 (主に人間) を検出し、
特定の物体 (主に人間) を構成する Keypoint の情報を推定し、物体の向きなどを推定することが目的.
日本語では、姿勢推定.
Face Detection
- Face Detection
Lane Detection
道路のエリアの検出.
- paper with code のタスクのページ
Counting
Crowd Counting
- paperswithcode.com
- paper with code のタスクのページ
セグメンテーション / Segmentation
物体検出は、対象物体を囲む四角い領域を推定するのがタスクであるが、
物体のと背景との切り分けて認識するタスクをセグメンテーション / Segmentationという.
- Segmentation
Congealing
- Neural Congealing: Aligning Images to a Joint Semantic Atlas
- [2023]
- arxiv.org
画像生成 / Image Generation
スタイル変換 / Style Transfer
- スタイル変換 / Style Transfer
Image Restoration / Super Resolution / 画像補間
- Image Restoration / Super Resolution / 画像補間
異常検知 / Image Anomaly Detection
- 異常検知 / Image Anomaly Detection
Scene Graph Generation / SGG
Panoptic Scene Graph Generation / PSG
- Panoptic Scene Graph Generation / PSG
Image Retrieval
- Image Retrieval
Image Compression / 画像圧縮
Neural Image Compression
EVC / 2023
- EVC: Towards Real-Time Neural Image Compression with Mask Decay
- [2023]
- arxiv.org
Affordance Grounding
画像内のどの部分が、何のアクションを行なっているかを理解する.
LOCATE / 2023
- LOCATE: Localize and Transfer Object Parts for Weakly Supervised Affordance Grounding
- [2023]
- arxiv.org
- reagan1311.github.io
3D
Depth Estimation
- Depth Estimation
新規視点画像生成 / Neural Rendering
- 新規視点画像生成 / Neural Rendering
マルチモーダルタスク
Vision Language
- Vision Language
画像キャプション / Image Caption
画像から物体間の関係性を表現するのが、画像キャプション / Image Caption
- Image Caption
参考
- Multi-Task Learning with Deep Neural Networks: A Survey
- [2020]
- arxiv.org
書籍
- 画像認識
- 1 画像認識の概要
- 1.2 画像認識の分類
- 1 画像認識の概要