贡献者: xzllxls
深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks, DCGAN)是生成对抗网络的一种基本实现,最初由文献 [1] 提出。顾名思义,该网络模型的生成器采用的是深层卷积网络,即由多层卷积层堆叠而成。
建立稳定的深度卷积生成对抗网络的要点是 [1]:
图 $1$ 是深度卷积生成对抗网络生成器结构的一个典型例子。在该模型中,输入的是维度为 $100$ 的随机噪音,服从均匀分布。数据经过一系列分数步长跳跃卷积(转置卷积,又称为反卷积),最终转换为 $64 \times64$ 像素的图像。该网络结构中没有全连接层和池化层。
图 $2$ 表示的是用深度卷积生成对抗网络生成的一些卧室的图片。这些图片是模型经过 $5$ 轮训练之后生成的结果 [1]。
一个很有趣的事情是,当生成模型训练好时,内隐空间中的表示矢量经过一定运算之后,再送入模型,能够产生有意义的输出结果,而这些新的结果还在原来的数据空间中。该事实表明模型学习到的内隐表示空间是具有线性结构的 [1]。图 $3$ 展示的是一个典型的例子。每一列的三个图片所对应的表示矢量求平均值,生成最下面一行的三个图片,然后再对这三个图片的表示矢量做运算:vector(” smiling woman”) - vector(” neutral woman”) + vector(” neutral man”) = vector("smiling man").
参考文献:
[1] ^ A. Radford, L. Metz, and S. Chintala, “Unsupervised representation learning with deep convolutional generative adversarial networks,” arXiv preprint arXiv:1511.06434, 2015.