


【データセット】Human Detection

データセット #まとめ編 画像データ
Index
Human Detection Dataset
Market-1501 / 2015
CUHK-SYSU / CS Dataset / 2016
PRW Dataset / 2016
CityPersons / CP Dataset / 2017
CrowdHuman / 2018
MIAP / 2021

【深層学習】Person of Interest / POI

Index
Person of Interest / POI
CNN を用いた Object Tracking.
参考
POI: Multiple Object Tracking with High Performance Detection and Appearance Feature

【動画像処理】Offline Object Tracking

Index
Offline Object Tracking
アルゴリズム
NOMT / 2015
MHT / 2015
MCMOT /2016
JMC / 2016
MC joint / 2016
QuandMOT / 2017
EDMT / 2017
NL-LMP / 2017
LMP / 2017
IOU Tracker / 2017
jCC / 2018
eHAF / 2019
Message Passing Networks / MPN Tr

【統計学】同時確率分布 / Joint Probability Distribution

2 次元の確率分布
同時確率分布 / Joint Probability Distribution
つの離散型の確率変数 が存在するとする.
のとりうる値は、
のとりうる値は、
であるとする.
変数の組み合わせ は、 個の異なった値をとる.

【深層学習】Weight Initialization

Index
Weight Initialization
深層学習における重みパラメータの最初の決定方法.
アルゴリズム
ZerO / 2021
ZerO Initialization: Initializing

【深層学習】Hungry Hungry Hippo / H3

Index
Hungry Hungry Hippo / H3
状態空間モデル / State Space Model / SSM
Attention 時系列解析
参考
Hungry Hungry Hippos: Towards Language Modeling wit

【時系列解析】Attention #まとめ編

Index
Attention
時系列解析における Attention を用いた手法をまとめる.
アルゴリズム
Dual-Stage Attention-Base RNN / DA RNN / 2017
Transformer / 2017
- TSDFNet / 2022
H3 / 2022

【時系列解析】状態空間モデル / State Space Model / SSM

Index
状態空間モデル
時系列解析の手法の一つ.
線形ガウス型モデル
カルマンフィルター / Kalman Filter
パーティクルフィルター / 粒子フィルター
応用
Structured State Space Sequence Model / S4 Model
H3 / 2022
参考
書籍
Web サイト

【深層学習】スタイル変換 / Style Transfer #まとめ編 #01

Index
スタイル変換 / Style Transfer
Diffusion Model を利用した、スタイル変換 / Style Transfer のアルゴリズムをまとめる.
Imagic / 2022
InstructPix2Pix / 2022
StyO / 2023
Image Editing


Index
InstructPix2Pix
Conditional Diffusion Model.
Conditional の部分に pix2pix を想起か?
Method
学習画像の生成
Text の生成
画像の生成
参考
Web サイト

【解析学】分野一覧 #まとめ編

Index
解析学
微分積分学
積分法
微分方程式
常微分方程式
偏微分方程式
関数解析学 / 位相解析学
フーリエ変換 / Fourier Transform
作用素
Jensen の不等式
参考
書籍
Web サイト

【数学】分野一覧 #まとめ編

Index
数学基礎論
数理論理学
集合論
位相空間論
基礎数学
代数学 / Algebra
解析学 / Analysis
幾何学 / Geometry
応用数学
確率論・統計学
グラフ理論
数値解析
Monte Carlo Method / モンテカルロ法
参考

【データセット】マルチモーダルデータ #まとめ編

Index
マルチモーダルデータ
Flickr30k / 2015
CLEVR / 2016
Conceptual Captions / 2018
WebImageText / 2021
LAION-5B / 2022
LAION-115M / 2022
Outdoor Multimodal Dataset / OMMO Dataset / 2

【深層学習】Model Compression

Index
Model Compression
Pruning / 枝刈り
A Fast Post-Training Pruning Framewor
Quantize / 量子化
Distillation / 蒸留
その他
OTOV2 / 2023
参考
Web サイト

【深層学習】Dataset Distillation #まとめ編

Index
Dataset Distillation / データセット蒸留
Dataset Distillation / データセット蒸留は、オリジナルとなる大規模なデータセットから、小規模なデータセットを生成する手法.
FRePo / 2022
PRO2 / 2023
参考


Index
LEGO-Net
LEarning reGular rearrangement of Objects in messy roosm
タスク
Indoor Scene Synthesis
室内シーン内の物体のレイアウトを作成するタスク. 2D or
Training Dataset
3D-FRONT dataset
参考

【点群処理】Indoor Scene Synthesis

Index
Indoor Scene Synthesis
室内シーン内の物体のレイアウトを作成するタスク. 2D or 3D のタスク.
アルゴリズム
LEGO-Net / 2023
参考

【マルチモーダル】Transformer #まとめ編

Index
アルゴリズム
OSCAR / 2020
Perceiver / 2021
WuDao 2.0 / 2021
MultiModality-to-MultiModality Multitask Mega-transformer / M6 / 2021
VATT / 2021
DiT / 2022
EVA / 2022
Zorro / 2023
MAGVLT / 2023
VioLA / 2023
参考
Web サイト

【自然言語処理】Transformer #まとめ編

Index
アルゴリズム
BERT / 2018 - ★
GPT / 2018 - ★
Memory Compressed Transformer / 2018
Transformer-XL / 2019
Multi-Task Deep Neural Network / MT-DNN / 2019
XLNet / 2019
ERNIE / 2019
Sparse Transformer / 2019
Compressive Transformers

【深層学習】Deformable Attention Transformer / DAT

Index
Deformable Attention Transformer / DAT
参考
Vision Transformer with Deformable Attention [2022]
Web サイト

【深層学習】MOTR / Multiple-Object Tracking with Transformer #実装編

Index
MOTR / Multiple-Object Tracking with Transformer
Transformer を利用した Object Tracking.
実装
処理の実行

【動画像処理】Transformer #まとめ編

Index
動画への応用
アルゴリズム
VisTR / 2020
ViViT / 2021
Memory-efficient Bidirectional Transformer / MeBT / 2023
Video Taskformer / 2023
Streaming Vision Transformer / S-ViT / 2023
SVT / 2023
Adaptive Matting / AdaM / 2023
StepForm

【深層学習】Deformable DETR

Index
Deformable DETR
DETR の改善手法.
Deformable Attention Module
Multi-scale Deformable Attention Module
その他の工夫
Iterative Bounding Box Refinement
参考
Web サイト

【マルチモーダル】生成モデル / Generative Mode #まとめ編

Index
生成モデル
Vision Language における生成モデルをまとめる.
参考
Google Research, 2022 & Beyond: Language, Vision and Generative Mode

【画像処理】Face Detection

Index
Face Detection
画像中から顔を検出する
アルゴリズム
ArcFace
Sub-center ArcFace
Face Recognition / 顔認識
AttenFace / 2022
データセット
F2LA
参考

【深層学習】3D CNN #まとめ編

Index
3D CNN
基本手法
3D Convolutional Neural Networks for Human Action Recognition [2013]
応用手法
C3D / 2014
I3D / 2017
参考


Index
XAI
説明可能な AI.
参考
Explainable Artificial Intelligence (XAI): Concepts, Taxonomies, Opportunities and Challenges toward Responsible AI [2019]
書籍
Web サイト

【機械学習】Imitation Learning / 模倣学習

Index
Imitation Learning / 模倣学習
アルゴリズム
NIFT / 2022
NIFT: Neural Interaction Field and Template fo
MimicPlay / 2023
CACTI / 2023
参考


Index
EnvEdit
Vision-Language Navigationに利用するために、Style Transfer を利用した Data Augmentation.
参考

【マルチモーダル】タスク一覧 #まとめ編

Index
マルチモーダルなタスク
Vision Language
Text to 3D
Point-E / 2022
DreamFusion / 2022
Data2text Generation
Chart-to-Text / 2022
Text to Video
Audio to Video
Talking Face Generation
Text-to-Motion
MDM / 2022
Document Analysis
Stru