HyperAIHyperAI

Command Palette

Search for a command to run...

StepEval Audio Paralinguistic 副语言理解评估数据集

日期

5 个月前

大小

440.73 MB

数据集组织

StepFun 阶跃星辰

论文 URL

2507.16632

许可证

Apache 2.0

StepEval Audio Paralinguistic 是由 StepFun AI 团队于 2025 年发布的一个音频副语言理解评估数据集,相关论文为「Step-Audio 2 Technical Report」,旨在评估 AI 模型在语音中理解副语言信息(如性别、年龄、语调、情绪等)方面的能力。

该数据集由 550 个语音样本组成,均匀分布在 11 个任务维度 上:包括性别(gender)、年龄(age)、音色(timbre)、情绪(emotion)、音高(pitch)、节奏(rhythm)、语速(speed)、说话风格(style)、人声活动(vocal)、场景(scenario)与事件类型(event)。其中前 8 项任务基于 400 条公开播客中的中文语音片段采样,后三项任务则分别从 AudioSet(事件)、 CochlScene(环境场景)、 VocalSound(人声类声效)中各采样 50 条音频。所有样本时长均控制在 30 秒以内,统一重采样为 24 kHz,并由专业团队进行自然语言标注。

StepEval-Audio-Paralinguistic.torrent
做种 1正在下载 0已完成 24总下载量 103
  • StepEval-Audio-Paralinguistic/
    • README.md
      1.77 KB
    • README.txt
      3.54 KB
      • data/
        • StepEval-Audio-Paralinguistic.zip
          440.73 MB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供