Command Palette

Search for a command to run...

5 个月前

π^3: 可扩展的置换等变视觉几何学习

Yifan Wang Jianjun Zhou Haoyi Zhu Wenzheng Chang Yang Zhou Zizun Li Junyi Chen Jiangmiao Pang Chunhua Shen Tong He

π^3: 可扩展的置换等变视觉几何学习

摘要

我们介绍了一种名为pi³的前馈神经网络,该网络提供了一种新颖的视觉几何重建方法,打破了对传统固定参考视图的依赖。以往的方法通常将其重建结果锚定在一个指定的视点上,这种归纳偏见可能导致在参考视图选择不佳时出现不稳定性和失败。相比之下,pi³采用了完全置换等变架构来预测仿射不变相机姿态和尺度不变局部点云图,无需任何参考帧。这一设计使得我们的模型对输入顺序具有内在鲁棒性,并且具有很高的可扩展性。这些优势使我们简单且无偏见的方法在包括相机姿态估计、单目/视频深度估计和密集点云图重建在内的广泛任务中实现了最先进的性能。代码和模型已公开可用。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供