Command Palette

Search for a command to run...

1 天前

VOccl3D:一种用于真实遮挡下3D人体姿态与形状估计的视频基准数据集

Yash Garg Saketh Bachu Arindam Dutta Rohit Lal Sarosij Bose Calvin-Khang Ta M. Salman Asif Amit Roy-Chowdhury

VOccl3D:一种用于真实遮挡下3D人体姿态与形状估计的视频基准数据集

摘要

人体姿态与形状(HPS)估计方法已得到广泛研究,许多方法在真实场景图像和视频中展现出优异的零样本性能。然而,在涉及复杂人体姿态或显著遮挡的挑战性场景下,这些方法往往表现不佳。尽管已有部分研究针对遮挡条件下的3D人体姿态估计问题,但其评估通常基于缺乏真实或严重遮挡的基准数据集——例如,大多数现有数据集通过在人体区域随机添加补丁或使用剪贴画风格的叠加图来引入遮挡,这可能无法真实反映现实世界中的复杂挑战。为弥补现有真实遮挡数据集的不足,我们提出一个新型基准数据集——VOccl3D,即一个基于视频、包含3D人体姿态与形状标注的人体遮挡数据集。受AGORA和BEDLAM等工作的启发,我们利用先进的计算机图形学渲染技术构建该数据集,融合了多样的真实世界遮挡场景、丰富的服装纹理以及多样化的身体运动。此外,我们在该数据集上对近期的HPS方法CLIFF和BEDLAM-CLIFF进行了微调,结果表明,这些方法在多个公开数据集以及我们数据集的测试集上均实现了显著的定性和定量性能提升,并在与当前最先进方法的对比中表现出优越性能。进一步地,我们利用该数据集对现有目标检测器YOLO11进行微调,有效提升了遮挡条件下的行人检测性能,从而构建出一个在遮挡环境下具有鲁棒性的端到端HPS估计系统。总体而言,该数据集为未来致力于应对遮挡问题的方法研究提供了宝贵资源,相较于现有遮挡数据集,提供了更加真实可靠的评估基准。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
VOccl3D:一种用于真实遮挡下3D人体姿态与形状估计的视频基准数据集 | 论文 | HyperAI超神经