オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【動画像処理】Diffusion Model #まとめ編

Index

アルゴリズム

Diffusion Model を利用した動画像処理の手法をまとめる.

gen1 / 2023

VIdeo の生成.

Masked Enhanced Block U-Net / 2023

  • Learning 3D Photography Videos via Self-supervised Diffusion on Single Images

VideoFusion / 2023

拡散モデルを使った動画生成.

で中心フレームのデノイジングを行った後、他フレームはそこからの差分のデノイジングのみモデル化する. 学習が容易になるだけでなく、画像で事前学習した大きなモデルで一度推論し、差分は小さなモデルで扱えるため効率が良い



  • VideoFusion: Decomposed Diffusion Models for High-Quality Video Generation

NUWA-XL / 2023

Video 生成.

  • NUWA-XL: Diffusion over Diffusion for eXtremely Long Video Generation

MC Diffusion / 2023

  • Motion-Conditioned Diffusion Model for Controllable Video Synthesis

タスク

Video Editing

Video と Text (編集内容) を入力として、変更された動画を出力する.

Image Editing の拡張.

Dreamix / 2023

  • Dreamix: Video Diffusion Models are General Video Editors

Video-P2P / 2023

Edit-A-Video / 2023

FateZero / 2023

Pix2Video / 2023

vid2vid-zero / 2023

  • Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models

ツール

ComfyUI

TrailBlazer