Command Palette
Search for a command to run...
Xi Chen Yan Duan Rein Houthooft John Schulman Ilya Sutskever Pieter Abbeel

摘要
本文介绍了InfoGAN,一种信息论扩展的生成对抗网络(Generative Adversarial Network, GAN),能够在完全无监督的情况下学习解耦表示。InfoGAN不仅是一个生成对抗网络,还最大化了一小部分潜在变量与观测值之间的互信息。我们推导了一个可以高效优化的互信息目标的下界,并展示了我们的训练过程可以被解释为Wake-Sleep算法的一种变体。具体而言,InfoGAN在MNIST数据集上成功地将书写风格与数字形状解耦,在3D渲染图像上将姿态与光照解耦,在SVHN数据集上将背景数字与中心数字解耦。此外,它还在CelebA人脸数据集上发现了包括发型、眼镜的存在/缺失以及情感在内的视觉概念。实验结果表明,InfoGAN学习到的可解释表示与现有全监督方法学习到的表示具有竞争力。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-generation-on-cub-128-x-128 | InfoGAN | FID: 13.20 Inception score: 47.32 |
| image-generation-on-stanford-cars | InfoGAN | FID: 17.63 Inception score: 28.62 |
| image-generation-on-stanford-dogs | InfoGAN | FID: 29.34 Inception score: 43.16 |
| unsupervised-image-classification-on-mnist | InfoGAN | Accuracy: 95 |
| unsupervised-mnist-on-mnist | InfoGAN | Accuracy: 95 |