Command Palette
Search for a command to run...
Sangdoo Yun¹ Dongyoon Han¹ Seong Joon Oh² Sanghyuk Chun¹ Junsuk Choe¹,³ Youngjoon Yoo¹

摘要
区域丢弃策略已被提出以增强卷积神经网络分类器的性能。这些策略已被证明在引导模型关注物体的非关键部分(例如人的腿部而非头部)方面非常有效,从而使网络具有更好的泛化能力和目标定位能力。然而,当前的区域丢弃方法通过叠加黑色像素块或随机噪声来移除训练图像中的信息像素,这种移除方式并不理想,因为它会导致信息丢失并降低训练效率。因此,我们提出了CutMix数据增强策略:在训练图像之间切割和粘贴图像块,同时根据图像块的面积比例混合真实标签。通过高效利用训练像素并保留区域丢弃的正则化效果,CutMix在CIFAR和ImageNet分类任务以及ImageNet弱监督定位任务中始终优于最先进的数据增强策略。此外,与以往的数据增强方法不同,我们的CutMix训练的ImageNet分类器作为预训练模型时,在Pascal检测和MS-COCO图像描述基准测试中也表现出一致的性能提升。我们还展示了CutMix提高了模型对输入损坏的鲁棒性和其在分布外检测方面的性能。源代码和预训练模型可在https://github.com/clovaai/CutMix-PyTorch 获取。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| domain-generalization-on-imagenet-a | CutMix (ResNet-50) | Top-1 accuracy %: 7.3 |
| image-captioning-on-coco | NIC (ResNet-50, CutMix) | BLEU-1: 64.2 BLEU-2: 46.3 BLEU-3: 33.6 BLEU-4: 24.9 CIDEr: 77.6 METEOR: 23.1 ROUGE: 49 |
| image-classification-on-cifar-10 | PyramidNet-200 + CutMix | Percentage correct: 97.12 |
| image-classification-on-cifar-100 | PyramidNet-200 + Shakedrop + Cutmix | Percentage correct: 86.19 |
| image-classification-on-imagenet | ResNet-50 (CutMix) | Top 1 Accuracy: 78.4% |
| image-classification-on-imagenet | ResNeXt-101 (CutMix) | Top 1 Accuracy: 80.53% |
| image-classification-on-omnibenchmark | CutMix | Average Top-1 Accuracy: 31.1 |
| semantic-segmentation-on-acdc-scribbles | CutMix | Dice (Average): 70.5% |