Command Palette
Search for a command to run...
Wenzhe Shi Jose Caballero Ferenc Huszár Johannes Totz Andrew P. Aitken Rob Bishop Daniel Rueckert Zehan Wang

摘要
最近,基于深度神经网络的几种模型在单图像超分辨率的重建精度和计算性能方面取得了显著成功。在这些方法中,低分辨率(LR)输入图像通常通过单一滤波器(通常是双三次插值)放大到高分辨率(HR)空间,然后再进行重建。这意味着超分辨率(SR)操作是在HR空间中执行的。我们证明了这种方法次优且增加了计算复杂度。本文提出了一种能够在单个K2 GPU上实现实时1080p视频超分辨率的卷积神经网络(CNN)。为了实现这一目标,我们设计了一种新颖的CNN架构,在该架构中特征图是在LR空间中提取的。此外,我们引入了一种高效的子像素卷积层,该层学习一系列放大滤波器,将最终的LR特征图放大为HR输出。通过这种方式,我们将SR流程中的手工设计的双三次滤波器替换为针对每个特征图专门训练的更复杂的放大滤波器,同时降低了整体SR操作的计算复杂度。我们使用公开数据集中的图像和视频对所提出的方案进行了评估,并显示其性能显著优于先前基于CNN的方法(图像提升+0.15 dB,视频提升+0.39 dB),并且速度提高了近一个数量级。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-super-resolution-on-bsd100-4x-upscaling | ESPCN | MOS: 2.01 PSNR: 27.02 SSIM: 0.7442 |
| image-super-resolution-on-set14-4x-upscaling | ESPCN | MOS: 2.52 PSNR: 27.66 SSIM: 0.8004 |
| video-super-resolution-on-msu-video-upscalers | ESPCN | PSNR: 26.25 SSIM: 0.926 VMAF: 47.19 |
| video-super-resolution-on-msu-vsr-benchmark | ESPCN | 1 - LPIPS: 0.765 ERQAv1.0: 0.521 FPS: 3.333 PSNR: 26.714 QRCRv1.0: 0 SSIM: 0.811 Subjective score: 2.099 |
| video-super-resolution-on-ultra-video-group | ESPCN | Average PSNR: 37.91 |
| video-super-resolution-on-ultra-video-group | bicubic | Average PSNR: 36.20 |
| video-super-resolution-on-vid4-4x-upscaling | ESPCN | MOVIE: 6.54 PSNR: 25.06 SSIM: 0.7394 |
| video-super-resolution-on-xiph-hd-4x | ESPCN | Average PSNR: 31.67 |
| video-super-resolution-on-xiph-hd-4x | bicubic | Average PSNR: 30.30 |