Command Palette
Search for a command to run...
VAP-Data 视觉动作表现数据集
VAP-Data 是由字节跳动联合香港中文大学于 2025 年发布的目前规模最大的语义控制视频生成数据集,相关论文成果为「Video-As-Prompt: Unified Semantic Control for Video Generation」,旨在为可控视频生成、可控动作合成、多模态视频模型等方向提供高质量训练与评测基准。
该数据集包含超过 90,000 条精心整理的配对样本,覆盖 100 种细粒度语义条件,跨越概念、风格、动作和镜头四大语义类别,每类语义均包含多组相互对齐的视频实例。视频内容在光照、视角、场景和动态方式上极具多样性,能够支持构建跨语义、精细可控的视频生成系统,并为模型的可控性与泛化能力提供全面评测环境。
