生成モデル
- yhayato1320.hatenablog.com

Index

Index
基本アルゴリズム
応用アルゴリズム
タスク・データ分野
テクニック・工夫
アプリケーション・サービス
研究
参考
- 書籍
- Web サイト
  - Tweet
- 動画

基本アルゴリズム

SBM と DDPM を合わせたモデルを拡散モデルと呼ぶ.

スコアベースモデル / SBM

スコアベースモデル / SBM
- yhayato1320.hatenablog.com

Diffusion Probabilistic Model / DPM / 2015

Diffusion Probabilistic Model / DPM
- Reverse Diffusion Process
- Forward Diffusion Process
- yhayato1320.hatenablog.com

Denoising Diffusion Probabilistic Model / DDPM / 2020

Denoising Diffusion Probabilistic Model / DDPM
- yhayato1320.hatenablog.com

応用アルゴリズム

Latent Diffusion Model / LDM / 2021

Latent Diffusion Model / LDM
- yhayato1320.hatenablog.com

Stable Diffusion v1

Stable Diffusion
- yhayato1320.hatenablog.com

Guided Diffusion / 2021

画像生成の改善手法.

Guided Diffusion
- yhayato1320.hatenablog.com

Diffusion Transformer / DiT 2022

Transformer の導入.

Diffusion Transformer / DiT
- yhayato1320.hatenablog.com

Imagen / 2022

Imagen
- yhayato1320.hatenablog.com

eDiff-I / 2022

eDiff-I
- yhayato1320.hatenablog.com

DPM-Solver / 2022

推論回数を減らすために、微分方程式を利用した手法.

DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps
- [2022]
- arxiv.org

EDM / 2022

拡散モデルを訓練・ネットワーク・サンプリングの3モジュールに分解して設計を再考した手法.

Elucidating the Design Space of Diffusion-Based Generative Models
- [2022]
- arxiv.org

Cold Diffusion / 2022

Cold Diffusion
- yhayato1320.hatenablog.com

SceneDiffuser / 2023

Diffusion-based Generation, Optimization, and Planning in 3D Scenes
- [2023]
- arxiv.org

DIffuson-based Residual Augmentation Codec / DIRAC / 2023

Neural Image Compression with a Diffusion-Based Decoderv
- [2023]
- arxiv.org

Simple Diffusion / 2023

高解像度画像の生成の高速化.

simple diffusion: End-to-end diffusion for high resolution images
- [2023]
- arxiv.org

Mixture of Diffusers / 2023

Mixture of Diffusers for scene composition and high resolution image generation
- [2023]
- arxiv.org
- github.com

Dual-CycleDiffusion / 2023

Eliminating Prior Bias for Semantic Image Editing via Dual-Cycle Diffusion
- [2023]
- arxiv.org

Design Booster / 2023

Design Booster: A Text-Guided Diffusion Model for Image Translation with Spatial Layout Preservation
- [2023]
- arxiv.org

SE3 / 2023

SE(3) diffusion model with application to protein backbone generation
- [2023]
- arxiv.org

Iterative Coherent Identity Injection / 2023

Zero-shot Generation of Coherent Storybook from Plain Text Story using Diffusion Models
- [2023]
- arxiv.org

UniPC / 2023

UniPC: A Unified Predictor-Corrector Framework for Fast Sampling of Diffusion Models
- [2023]
- arxiv.org

Q-Diffusion / 2023

Q-Diffusion: Quantizing Diffusion Models
- [2023]
- arxiv.org

PFGM++ / 2023

PFGM++: Unlocking the Potential of Physics-Inspired Generative Models
- [2023]
- arxiv.org

SR3+ / 2023

Denoising Diffusion Probabilistic Models for Robust Image Super-Resolution in the Wild
- [2023]
- arxiv.org

Projected latent Video Diffusion Model / PVDM / 2023

Video Probabilistic Diffusion Models in Projected Latent Space
- [2023]
- arxiv.org

Denoising Diffusion Operators / DDO / 2023

Score-based Diffusion Models in Function Space
- [2023]
- arxiv.org

Universal Guidance Diffusion / 2023

Universal Guidance for Diffusion Models
- [2023]
- arxiv.org
github.com
- github

I2SB / 2023

I2SB: Image-to-Image Schrödinger Bridge
- [2023]
- arxiv.org

Single Motion Diffusion / 2023

Single Motion Diffusion
- [2023]
- arxiv.org

PRedItOR / 2023

PRedItOR: Text Guided Image Editing with Diffusion Prior
- [2023]
- arxiv.org

MultiDiffusion / 2023

MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation
- [2023]
- arxiv.org

Latent Diffusion Prior / 2023

Text-driven Visual Synthesis with Latent Diffusion Prior
- [2023]
- arxiv.org
latent-diffusion-prior.github.io
- project page

Composer / 2023

Composer: Creative and Controllable Image Synthesis with Composable Conditions
- [2023]
- arxiv.org

Cross-domain Compositing / 2023

Cross-domain Compositing with Pretrained Diffusion Models
- [2023]
- arxiv.org

Dual Pseudo Training / DPT / 2023

Diffusion Models and Semi-Supervised Learners Benefit Mutually with Few Labels
- [2023]
- arxiv.org

Differentially Private Diffusion Models / 2023

Differentially Private Diffusion Models Generate Useful Synthetic Images
- [2023]
- arxiv.org

Diffusion Probabilistic Fields / DPF / 2023

Diffusion Probabilistic Fields
- [2023]
- arxiv.org

TRACT / 2023

TRACT: Denoising Diffusion Models with Transitive Closure Time-Distillation
- [2023]
- arxiv.org

Cones / 2023

2 つの概念を合成した画像を生成.

Cones: Concept Neurons in Diffusion Models for Customized Generation
- [2023]
- arxiv.org

FGDS / 2023

Fast Diffusion Sampler for Inverse Problems by Geometric Decomposition
- [2023]
- arxiv.org

Min-SNR-γ / 2023

高速化.

Efficient Diffusion Training via Min-SNR Weighting Strategy
- [2023]
- arxiv.org

FreeDoM / 2023

学習済みモデルを利用する.

FreeDoM: Training-Free Energy-Guided Conditional Diffusion Model
- [2023]
- arxiv.org

WaveDiff / 2023

Wavelet Diffusion Models are fast and scalable Image Generators
- [2023]
- arxiv.org
- github.com

DOODL / 2023

End-to-End Diffusion Latent Optimization Improves Classifier Guidance
- [2023]
- arxiv.org

DiffCollage / 2023

DiffCollage: Parallel Generation of Large Content with Diffusion Models
- [2023]
- arxiv.org
- research.nvidia.com

Consistency Models

Consistency Models
- yhayato1320.hatenablog.com

Patch Diffusion / 2023

Patch Diffusion: Faster and More Data-Efficient Training of Diffusion Models
- [2023]
- arxiv.org

タスク・データ分野

画像

画像処理
- yhayato1320.hatenablog.com

3D

点群処理
- yhayato1320.hatenablog.com

時系列

時系列解析
- yhayato1320.hatenablog.com

自然言語

Diffusion-LM / 2022

文章生成のタスク.

Diffusion-LM
- yhayato1320.hatenablog.com

音響

音声解析解析
- yhayato1320.hatenablog.com

動画像

動画像解析
- yhayato1320.hatenablog.com

マルチモーダル

マルチモーダル
- yhayato1320.hatenablog.com

Text-to-Image

Text-to-Image
- yhayato1320.hatenablog.com

Image Editing

Image Editing
- yhayato1320.hatenablog.com

テクニック・工夫

Model Editing

学習済みモデルを都合が良いように修正する.

Erasing Concepts from Diffusion Models
- [2023]
- arxiv.org

Watermarking

著作権などの対策.

A Recipe for Watermarking Diffusion Models
- [2023]
- arxiv.org

ReVersion / 2023

ReVersion: Diffusion-Based Relation Inversion from Images
- [2023]
- arxiv.org
- ziqihuangg.github.io
- github.com

MAE

Diff MAE / 2023

Diffusion Models as Masked Autoencoders
- [2023]
- arxiv.org
- weichen582.github.io

Fine Turning

DiffFit / 2023

DiffFit: Unlocking Transferability of Large Diffusion Models via Simple Parameter-Efficient Fine-Tuning
- [2023]
- arxiv.org

アプリケーション・サービス

X diffusion / Picasso Diffusion

huggingface.co

Textual Inversion Pipeline for Stable Diffusion

Textual Inversion Pipeline for Stable Diffusion
- devlibrary.withgoogle.com

Cool Japan Diffusion

研究

Understanding the Diffusion Objective as a Weighted Integral of ELBOs
- [2023]
- arxiv.org
Diffusion Models are Minimax Optimal Distribution Estimators
- [2023]
- arxiv.org

拡散モデルは分布推定の意味でミニマックス最適な推定誤差を達成可能であることを示した.

分布のサポートが低次元である場合は次元の呪いを回避し，Wasserstein距離の意味で最適レートを達成することも示している．

参考

Deep Unsupervised Learning using Nonequilibrium Thermodynamics
- [2015]
- v8
- Abstruct
- 1 Introduction
  - 1.1 Diffusion probabilistic models
  - 1.2 Relationship to other work
- 2 Algorithm
  - 2.1 Forward Trajectory
  - 2.2 Reverse Trajectory
  - 2.3 Model Probability
  - 2.4 Training
  - 2.5 Multiplying Distributions, and Computing Posteriors
  - 2.6 Entropy of Reverse Process
- arxiv.org
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models
- [2021 OpenAI]
- 2 Background
  - 2.1 Diffusion Models
- arxiv.org

書籍

拡散モデル
- 2 拡散モデル
- 拡散モデル　データ生成技術の数理
  - 作者:岡野原大輔
  - 岩波書店
  Amazon

Web サイト

What are Diffusion Models?
- lilianweng.github.io
- 翻訳版 :
  - zenn.dev
Stable Diffusion の仕組みを理解する
- tech-blog.abeja.asia
Hugging Face Diffusion Models Course
- github.com
NeurIPS 2022 参加報告後編
- コンピュータビジョン
  - 生成モデル
    - Imagen / EDM / MineDojo
- blog.recruit.co.jp
DiffusionによるText2Imageの系譜と生成画像が動き出すまで
speakerdeck.com
拡散モデルに入門してみる
- qiita.com

NeurIPS2022参加報告ということで、拡散モデルの研究動向をまとめました。
・応用の広がり
・理論的／実験的解析
・生成の高速化
関連論文はほぼ全て目を通しており、タイトルぐらいはどこかに出てくるはずです。ご活用ください！https://t.co/03LUGEtY8F
以下、スレッドで内容を簡単に紹介します。 pic.twitter.com/WYAGLCJEOD
— mi141 (@mi141) January 19, 2023

ということで、IBISML研究会にて学習済み拡散モデルの活用について講演させて頂きました！

講演で使ったマップ（と文献リスト）は以下です。今回試験的に作ってみたものなので、ご意見大募集です！
講演自体はたぶん再録してYouTubeで公開するような気がします（わからん） pic.twitter.com/E3j2Cx0C5B
— mi141 (@mi141) March 2, 2023

動画

【Deep Learning研修（発展）】データ生成・変換のための機械学習　第７回前編「Diffusion models」
- www.youtube.com
【AI論文解説】拡散モデルによるデータ生成の高速化技術 -概要編-
- www.youtube.com
【学会聴講報告】NeurIPS2022における拡散モデル研究動向 part1
- www.youtube.com