HyperAI

在 Discord 上讨论

日期

6 个月前

论文 URL

arxiv.org

许可证

Apache 2.0

标签

文本生成

AutoCaption 数据集由 Tjunlp 实验室于 2025 年发布的一个视频字幕基准数据集，相关论文成果为「Evaluating Multimodal Large Language Models on Video Captioning via Monte Carlo Tree Search」，旨在推动多模态大语言模型在视频字幕生成领域的研究。

数据集结构：

该数据集含 2 个子集，共 11,184 个样本：

sft_data：用于字幕模型的监督微调（9,419 个样本用于监督微调数据）
mcts_vcb：使用 MCTS 生成的标题和关键点进行评估（1,765 个样本用于评估 MCTS-VCB 基准）

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

在 Discord 上讨论

日期

6 个月前

论文 URL

arxiv.org

许可证

Apache 2.0

标签

文本生成

数据集结构：

该数据集含 2 个子集，共 11,184 个样本：

sft_data：用于字幕模型的监督微调（9,419 个样本用于监督微调数据）
mcts_vcb：使用 MCTS 生成的标题和关键点进行评估（1,765 个样本用于评估 MCTS-VCB 基准）

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

FrontierScience 推理科研任务评测数据集

2 个月前

VideoRewardBench 视频奖励模型评测数据集

2 个月前

OST-Bench 时空场景理解基准数据集

3 个月前

25.58 GB56

VAP-Data 视觉动作表现数据集

2 个月前

X-Dance 图像驱动舞蹈动作数据集

2 个月前

147.3 MB75

INFINITY-CHAT 真实开放式问答数据集

2 个月前

Arena-Write 写作生成评测数据集

2 个月前

AutoDock-GPU_Output 对接结果数据集

3 个月前

PhysDrive 驾驶员生理测试数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

AutoCaption 视频字幕基准数据集

数据集结构：

用 AI 构建 AI

HyperAI Newsletters

Command Palette

AutoCaption 视频字幕基准数据集

数据集结构：

相关数据集

FrontierScience 推理科研任务评测数据集

VideoRewardBench 视频奖励模型评测数据集

OST-Bench 时空场景理解基准数据集

VAP-Data 视觉动作表现数据集

X-Dance 图像驱动舞蹈动作数据集

INFINITY-CHAT 真实开放式问答数据集

Arena-Write 写作生成评测数据集

AutoDock-GPU_Output 对接结果数据集

PhysDrive 驾驶员生理测试数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

AutoCaption 视频字幕基准数据集

数据集结构：

相关数据集

FrontierScience 推理科研任务评测数据集

VideoRewardBench 视频奖励模型评测数据集

OST-Bench 时空场景理解基准数据集

VAP-Data 视觉动作表现数据集

X-Dance 图像驱动舞蹈动作数据集

INFINITY-CHAT 真实开放式问答数据集

Arena-Write 写作生成评测数据集

AutoDock-GPU_Output 对接结果数据集

PhysDrive 驾驶员生理测试数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

FrontierScience 推理科研任务评测数据集

VideoRewardBench 视频奖励模型评测数据集

OST-Bench 时空场景理解基准数据集

VAP-Data 视觉动作表现数据集

X-Dance 图像驱动舞蹈动作数据集

INFINITY-CHAT 真实开放式问答数据集

Arena-Write 写作生成评测数据集

AutoDock-GPU_Output 对接结果数据集

PhysDrive 驾驶员生理测试数据集

相关数据集

FrontierScience 推理科研任务评测数据集

VideoRewardBench 视频奖励模型评测数据集

OST-Bench 时空场景理解基准数据集

VAP-Data 视觉动作表现数据集

X-Dance 图像驱动舞蹈动作数据集

INFINITY-CHAT 真实开放式问答数据集

Arena-Write 写作生成评测数据集

AutoDock-GPU_Output 对接结果数据集

PhysDrive 驾驶员生理测试数据集