オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】Style Space

Style Space

Style GAN 2 の潜在的なスタイル空間を調査する.

第一に、チャネルごとの Style Parameter 空間である Style Space が、
他の中間潜在空間よりも、わかりやすいことを示す.

第二に、Style Channel の大規模な種類を検出する.

第三に、特定の属性を制御する Style Channel を識別する.

最後に、Style Space をコントロールすることによる、画像の編集・操作・manipulation の可能性.

テーマ

Style GAN における潜在変数について

Style GAN / Style GAN 2 のデータの生成には、いくつかの潜在変数が登場する.

最初の潜在変数  z\ \in\ Z は、正規分布からサンプリングされる.

次に、潜在変数  z を FCN で線形変換すること (Mapping Network) で、中間潜在変数  w\ \in\ W を得る.

中間潜在変数  w の潜在空間  W は、学習したデータの分布の性質を表していると主張されている.



次に、中間潜在変数  w は、Generator の Synthesis Network の各層 (Style GAN 2 では、Style Block) に対して、 異なる学習パラメータを介して線形 (アフィン) 変換を施し、スタイルパラメータ  s\ \in\ S を取得する.

スタイルパラメータ空間を Style Space と呼ぶ.



一部の手法では、中間潜在空間  W+ を利用しており、 異なる中間潜在変数  w が、Generator の Synthesis Network の各層 (Style GAN 2 では、Style Block) に対して、 入力される.



中間潜在空間  W+ は 「Style GAN で紹介された Style Mixing」 や
「Style GAN 2 での画像からの逆変換 (Image Inversion) 」などに利用される.

画像からの逆変換

  • Image2StyleGAN: How to Embed Images Into the StyleGAN Latent Space?

  • In-Domain GAN Inversion for Real Image Editing

DIC

この論文の最初の目標は、これらの潜在変数の潜在空間のどれが、 わかりやすい表現空間であるかを理解すること.

そのために、DIC / (Disentanglement / Completeness / Informativeness) Metrics を導入する.

参考

  • StyleSpace Analysis: Disentangled Controls for StyleGAN Image Generation
    • Abstract
    • 3 Disentanglement of StyleGAN latent spaces
    • 4 Detecting locally-active style channels
    • 5 Detecting attribute-specific channels
    • 6 Disentangled attribute manipulation
    • 7 Manipulation of Real Images
    • [2020]
    • arxiv.org

Web サイト

  • 【論文5分まとめ】StyleSpace Analysis