HyperAIHyperAI

Command Palette

Search for a command to run...

PubMedVision 医疗多模态评估数据集

日期

4 个月前

大小

2.31 GB

数据集组织

National Health Data Institute,Shenzhen
The Chinese University of Hong Kong, Shenzhen
深圳市大数据研究院

论文 URL

2406.19280

许可证

Apache 2.0

PubMedVision 是由深圳大数据研究院联合香港中文大学(深圳)、国家医疗健康大数据研究院(深圳)于 2024 年发布的一个用于医学多模态能力评估的数据集,相关论文成果为「HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale」,旨在为多模态大语言模型(MLLMs)在医疗视觉 – 文本理解任务方面提供标准化测试资源,以检验它们在医学领域的视觉知识融合与推理性能。

该数据集共包含约 130 万条医学视觉问答(VQA)样本,其中 647,031 条为对齐型 VQA,另有 647,031 条为指令微调 VQA 。 数据基于 914,960 张经过严格筛选的医学图像及其上下文文本(如标题与文中引用)构建,涵盖多种医学成像模态与解剖区域。每条样本由医学论文中的图像及说明性文字组成,并借助多模态大语言模型(如 GPT-4V)生成对应的图像描述、问题与答案。

数据集示例
PubMedVision2510.torrent
做种 1正在下载 0已完成 7总下载量 78
  • PubMedVision2510/
    • README.md
      1.94 KB
    • README.txt
      3.88 KB
      • data/
        • PubMedVision.zip
          2.31 GB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供