Command Palette
Search for a command to run...
Yiwen Huang Aaron Gokaslan Volodymyr Kuleshov James Tompkin

摘要
有一种广为流传的观点认为,生成对抗网络(GAN)难以训练,且文献中的GAN架构充斥着各种经验性技巧。本文对此提出反例,并以更严谨的范式构建了一个现代GAN基准模型。首先,我们推导出一种具有良好性质的正则化相对性GAN损失函数,该损失函数有效解决了此前需依赖大量临时性技巧才能应对的模式崩溃(mode dropping)和非收敛性问题。我们对所提出的损失函数进行了数学分析,并证明其具有局部收敛性保证,这与大多数现有相对性损失函数不同。其次,得益于这一新损失函数,我们能够完全摒弃所有经验性技巧,并用现代网络架构替代传统GAN中过时的主干网络。以StyleGAN2为例,我们提出了一条简化与现代化的路径,由此构建出一种新型极简基准模型——R3GAN。尽管结构简单,R3GAN在FFHQ、ImageNet、CIFAR和Stacked MNIST等多个数据集上的表现均超越了StyleGAN2,并在性能上可与当前最先进的GAN模型及扩散模型相媲美。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-cifar-10 | R3GAN | FID: 1.96 |
| image-generation-on-ffhq-256-x-256 | R3GAN | FID: 2.75 |
| image-generation-on-imagenet-32x32 | R3GAN | FID: 1.27 |