Command Palette

Search for a command to run...

VAP-Data 视觉动作表现数据集

日期

2 天前

机构

Bytedance(字节跳动)
The Chinese University of Hong Kong

论文链接

2510.20888

许可协议

Apache 2.0

VAP-Data 是由字节跳动联合香港中文大学于 2025 年发布的目前规模最大的语义控制视频生成数据集,相关论文成果为「Video-As-Prompt: Unified Semantic Control for Video Generation」,旨在为可控视频生成、可控动作合成、多模态视频模型等方向提供高质量训练与评测基准。

该数据集包含超过 90,000 条精心整理的配对样本,覆盖 100 种细粒度语义条件,跨越概念、风格、动作和镜头四大语义类别,每类语义均包含多组相互对齐的视频实例。视频内容在光照、视角、场景和动态方式上极具多样性,能够支持构建跨语义、精细可控的视频生成系统,并为模型的可控性与泛化能力提供全面评测环境。

数据集示例

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供