Command Palette
Search for a command to run...
Tsung-Yi Lin Piotr Dollár Ross Girshick Kaiming He Bharath Hariharan Serge Belongie

摘要
特征金字塔是识别系统中用于检测不同尺度物体的基本组件。然而,近期的深度学习目标检测器为了避免计算和内存开销较大的问题,部分放弃了金字塔表示方法。在本文中,我们利用了深度卷积网络固有的多尺度、金字塔层次结构,以极小的额外成本构建了特征金字塔。我们开发了一种具有横向连接的自上而下的架构,用于在所有尺度上生成高层次的语义特征图。该架构被称为特征金字塔网络(Feature Pyramid Network, FPN),在多个应用中作为通用特征提取器表现出显著的改进。在基本的Faster R-CNN系统中使用FPN,我们的方法在COCO目标检测基准测试中取得了单模型的最佳结果,无需复杂的调整和优化,超越了包括2016年COCO挑战赛获胜者在内的所有现有单模型记录。此外,我们的方法可以在GPU上以每秒5帧的速度运行,因此是一种实用且准确的多尺度目标检测解决方案。代码将公开发布。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-coco | Faster R-CNN + FPN | Hardware Burden: 2G box mAP: 36.2 |
| object-detection-on-coco-minival | FPN+ | AP50: 61.3 AP75: 43.3 APL: 52.6 APM: 43.3 APS: 22.9 box AP: 39.8 |
| pedestrian-detection-on-tju-ped-campus | FPN | ALL (miss rate): 38.08 HO (miss rate): 73.14 R (miss rate): 27.92 R+HO (miss rate): 35.67 RS (miss rate): 67.52 |
| pedestrian-detection-on-tju-ped-traffic | FPN | ALL (miss rate): 37.78 HO (miss rate): 60.30 R (miss rate): 22.30 R+HO (miss rate): 26.71 RS (miss rate): 35.19 |
| semantic-segmentation-on-potsdam | FPN | mIoU: 82.99 |
| semantic-segmentation-on-us3d | FPN | mIoU: 72.51 |
| semantic-segmentation-on-vaihingen | FPN | mIoU: 74.86 |