GAN简介

生成式对抗网络（GAN, Generative Adversarial Networks ）是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。

模型通过框架中（至少）两个模块：生成模型（Generative Model）和判别模型（Discriminative Model）的互相博弈学习产生相当好的输出。

通俗的讲，初始的生成网络（generated）与判别网络（discriminator）什么都不懂，把初始的生成网络比喻成画家，那么初始的判别网络就是鉴画师，什么都不懂的画师画了幅画，于是给鉴画师辨认是否画的好，鉴画师也什么都不懂，只能对比世界名画判断好坏，将意见反馈给画师，不停重复操作，画师不断进步的同时，鉴画师也会进步，画师最终会努力接近世界名画的水平，这就是GAN。

GAN应用

目前GAN最常使用的地方就是图像生成，如超分辨率任务，语义分割， 数据增加等等

GAN的基本结构

GAN是将一组向量矩阵输入生成网络中训练出一组虚假数据，再与真数据进行合并进入判别网络训练，虚假数据的判别网络训练标签为0，真数据的判别网络训练标签为1，不断循环训练，使生成图像逼近原始图像。

GAN的基本原理

首先从现有的数据中挑选出一批数据，组成Pdata(x)Pdata(x)，然后训练一个PG(x;θ)PG(x;θ)来产生数据(例如一个高斯混合模型)，我们希望产生的数据集PG(x;θ)PG(x;θ)与原来的数据Pdata(x)Pdata(x)越接近越好，即使得下面的似然函数达到最大值：

因此需要求得的参数为：

取对数，得：

GAN实践

激活函数

tanh

ReLu

sigmoid

Leaky ReLUs
ReLU是将所有的负值都设为零，相反，Leaky ReLU是给所有负值赋予一个非零斜率。Leaky ReLU激活函数是在声学模型（2013）中首次提出的。以数学的方式我们可以表示为：

是（1，+∞）区间内的固定参数。
下图是ReLU、Leaky ReLU、PReLU和RReLU的比较：

GAN在MNIST数据集上的体现

import os

os.environ["KERAS_BACKEND"] = "tensorflow"
import numpy as np
from tqdm import tqdm
import matplotlib.pyplot as plt

from keras.layers import Input
from keras.models import Model, Sequential
from keras.layers.core import Reshape, Dense, Dropout, Flatten
from keras.layers.advanced_activations import LeakyReLU
from keras.layers.convolutional import Convolution2D, UpSampling2D
from keras.layers.normalization import BatchNormalization
from keras.datasets import mnist
from keras.optimizers import Adam
from keras import backend as K
from keras import initializers

K.set_image_dim_ordering('th')

np.random.seed(1000)

# 为了与其他GAN实现保持一致，维度保留为100。
randomDim = 100

# MNIST数据加载
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = (X_train.astype(np.float32) - 127.5) / 127.5
X_train = X_train.reshape(60000, 784)

# Optimizer
adam = Adam(lr=0.0002, beta_1=0.5)

generator = Sequential()
generator.add(Dense(256, input_dim=randomDim, kernel_initializer=initializers.RandomNormal(stddev=0.02)))
generator.add(LeakyReLU(0.2))
generator.add(Dense(512))
generator.add(LeakyReLU(0.2))
generator.add(Dense(1024))
generator.add(LeakyReLU(0.2))
generator.add(Dense(784, activation='tanh'))
generator.compile(loss='binary_crossentropy', optimizer=adam)

discriminator = Sequential()
discriminator.add(Dense(1024, input_dim=784, kernel_initializer=initializers.RandomNormal(stddev=0.02)))
discriminator.add(LeakyReLU(0.2))
discriminator.add(Dropout(0.3))
discriminator.add(Dense(512))
discriminator.add(LeakyReLU(0.2))
discriminator.add(Dropout(0.3))
discriminator.add(Dense(256))
discriminator.add(LeakyReLU(0.2))
discriminator.add(Dropout(0.3))
discriminator.add(Dense(1, activation='sigmoid'))
discriminator.compile(loss='binary_crossentropy', optimizer=adam)

# 联合网络
discriminator.trainable = False
ganInput = Input(shape=(randomDim,))
x = generator(ganInput)
ganOutput = discriminator(x)
gan = Model(inputs=ganInput, outputs=ganOutput)
gan.compile(loss='binary_crossentropy', optimizer=adam)

dLosses = []
gLosses = []


# 绘制每个批次的损失
def plotLoss(epoch):
    plt.figure(figsize=(10, 8))
    plt.plot(dLosses, label='Discriminitive loss')
    plt.plot(gLosses, label='Generative loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()
    plt.savefig('images/gan_loss_epoch_%d.png' % epoch)


#创建一个生成MNIST图像
def plotGeneratedImages(epoch, examples=100, dim=(10, 10), figsize=(10, 10)):
    noise = np.random.normal(0, 1, size=[examples, randomDim])
    generatedImages = generator.predict(noise)
    generatedImages = generatedImages.reshape(examples, 28, 28)

    plt.figure(figsize=figsize)
    for i in range(generatedImages.shape[0]):
        plt.subplot(dim[0], dim[1], i + 1)
        plt.imshow(generatedImages[i], interpolation='nearest', cmap='gray_r')
        plt.axis('off')
    plt.tight_layout()
    plt.savefig('images/gan_generated_image_epoch_%d.png' % epoch)


# 保存生成器和鉴别器网络(和权重)，以供以后使用
def saveModels(epoch):
    generator.save('models/gan_generator_epoch_%d.h5' % epoch)
    discriminator.save('models/gan_discriminator_epoch_%d.h5' % epoch)


def train(epochs=1, batchSize=128):
    batchCount = X_train.shape[0] / batchSize
    print('Epochs:', epochs)
    print('Batch size:', batchSize)
    print('Batches per epoch:', batchCount)

    for e in range(1, epochs + 1):
        print('-' * 15, 'Epoch %d' % e, '-' * 15)
        # tqdm在运行行记录输出每轮训练进度
        for _ in tqdm(range(int(batchCount))):
            # 获得一组随机的输入噪声和图像
            noise = np.random.normal(0, 1, size=[batchSize, randomDim])
            imageBatch = X_train[np.random.randint(0, X_train.shape[0], size=batchSize)]

            # 生成虚假MNIST图像
            generatedImages = generator.predict(noise)
            X = np.concatenate([imageBatch, generatedImages])

            # 生成和实际数据的标签
            yDis = np.zeros(2 * batchSize)
            # One-sided label smoothing
            yDis[:batchSize] = 0.9

            # 训练判别器
            discriminator.trainable = True
            dloss = discriminator.train_on_batch(X, yDis)

            # 训练生成器
            noise = np.random.normal(0, 1, size=[batchSize, randomDim])
            yGen = np.ones(batchSize)
            discriminator.trainable = False
            gloss = gan.train_on_batch(noise, yGen)

        dLosses.append(dloss)
        gLosses.append(gloss)

        if e == 1 or e % 20 == 0:
            plotGeneratedImages(e)
            saveModels(e)

    # 描绘每个时代的损失
    plotLoss(e)


if __name__ == '__main__':
    train(200, 128)