Command Palette
Search for a command to run...
Adam Paszke; Abhishek Chaurasia; Sangpil Kim; Eugenio Culurciello

摘要
在移动应用中,实现实时像素级语义分割的能力至关重要。近期针对这一任务的深度神经网络存在需要大量浮点运算且运行时间较长的问题,这限制了它们的实用性。本文提出了一种名为ENet(高效神经网络)的新型深度神经网络架构,专门设计用于低延迟操作的任务。ENet的速度最高可提升18倍,所需的浮点运算(FLOPs)减少75倍,参数量减少79倍,并且其精度与现有模型相当或更高。我们已在CamVid、Cityscapes和SUN数据集上对其进行了测试,并报告了与现有最先进方法的对比结果以及网络在精度与处理时间之间的权衡。我们还展示了所提出的架构在嵌入式系统上的性能测量结果,并提出了可能的软件改进措施以进一步提高ENet的速度。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| real-time-semantic-segmentation-on-cityscapes | ENet | Frame (fps): 76.9 Time (ms): 13 mIoU: 58.3% |
| semantic-segmentation-on-cityscapes | ENet | Mean IoU (class): 58.3% |
| semantic-segmentation-on-scannetv2 | ENet | Mean IoU: 37.6% |