こんな方におすすめ

深層学習・ディープラーニングの手法として使われている「pix2pix」の基本的な内容について知りたい.

この記事では、pix2pixの基礎概念のまとめを行う.

Index

pix2pix とは

以前、Cycle GAN を述べた.

同じ「スタイル変換 / Style Transfor」の手法で、同時期に発表された「pix2pix」がある.

Cycle GAN とよく比較されるのをみるので、述べる.

Conditional GAN の一種、テクニック.

pix2pix_paper

通常の GAN 同様、Generator と Discriminator で構成されている.

Conditional GAN では、ラベル情報と画像情報を入力として、画像を出力する.

mnist だったら、「1」の画像と「1」というラベル情報を Generator に入力し、「1」の生成画像を出力させる.

ネットワークアーキテクチャは、論文ではU-Net が使われている.

Image-to-Image のアーキテクチャなら色々試す価値あり?、ResNet とか

Patch GAN と呼ばれる Discriminator のアーキテクチャが紹介されている.

主に２つの項目で構成されている.

Image-to-Image Translation with Conditional Adversarial Networks
- [2016]
- arxiv.org