オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】PatchGAN

  • こんな方におすすめ

深層学習・ディープラーニングの手法として使われている「PatchGAN」の基本的な内容について知りたい。



この記事では、PatchGANの基礎概念のまとめを行います。

「これから、機械学習ディープラーニングの学習をしたいから、その基本となるPatchGANの理解を深めたい」という方に向けた記事になります。



  • キーワード・知ってると理解がしやすい
    • GAN

目次

Patch GAN とは

pix2pix の論文「Image-to-Image Translation with Conditional Adversarial Networks」で紹介された手法。
Discriminator のアーキテクチャにおける工夫として紹介された。
論文中では、「Markovian Discriminator」とも記載されている

ネットワークアーキテクチャ

  • 入力 : 画像 (本物画像 or 偽物画像)
  • 出力 : 画像 (N x N の patch と呼ばれる score行列 : どれだけ本物かどうか)
  • FCN (Fully Convolutional Network) : 画像をCNNでダウンサンプリングしていく
    • Convolution - BatchNormalization - ReLu のレイヤーを複数回繰り返す

参考

  • pix2pix の論文 arxiv.org

  • pix2pix で参考にした論文

    • Precomputed Real-Time Texture Synthesis with Markovian Generative Adversarial Networks

arxiv.org

f:id:yhayato1320:20210327223009j:plain