HyperAIHyperAI

Command Palette

Search for a command to run...

AutoCaption 视频字幕基准数据集

在 Discord 上讨论

日期

6 个月前

论文 URL

arxiv.org

许可证

Apache 2.0

AutoCaption 数据集由 Tjunlp 实验室于 2025 年发布的一个视频字幕基准数据集,相关论文成果为「Evaluating Multimodal Large Language Models on Video Captioning via Monte Carlo Tree Search」,旨在推动多模态大语言模型在视频字幕生成领域的研究。

数据集结构:

该数据集含 2 个子集,共 11,184 个样本:

  • sft_data: 用于字幕模型的监督微调(9,419 个样本用于监督微调数据)
  • mcts_vcb: 使用 MCTS 生成的标题和关键点进行评估(1,765 个样本用于评估 MCTS-VCB 基准)

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供