HyperAI

在 Discord 上讨论

日期

2 个月前

数据集组织

论文 URL

2510.20888

许可证

Apache 2.0

标签

图生视频

文生视频

VAP-Data 是由字节跳动联合香港中文大学于 2025 年发布的目前规模最大的语义控制视频生成数据集，相关论文成果为「Video-As-Prompt: Unified Semantic Control for Video Generation」，旨在为可控视频生成、可控动作合成、多模态视频模型等方向提供高质量训练与评测基准。

该数据集包含超过 90,000 条精心整理的配对样本，覆盖 100 种细粒度语义条件，跨越概念、风格、动作和镜头四大语义类别，每类语义均包含多组相互对齐的视频实例。视频内容在光照、视角、场景和动态方式上极具多样性，能够支持构建跨语义、精细可控的视频生成系统，并为模型的可控性与泛化能力提供全面评测环境。