在 Discord 上讨论

日期

4 个月前

大小

2.31 GB

数据集组织

论文 URL

许可证

Apache 2.0

标签

PubMedVision 是由深圳大数据研究院联合香港中文大学（深圳）、国家医疗健康大数据研究院（深圳）于 2024 年发布的一个用于医学多模态能力评估的数据集，相关论文成果为「HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale」，旨在为多模态大语言模型（MLLMs）在医疗视觉 – 文本理解任务方面提供标准化测试资源，以检验它们在医学领域的视觉知识融合与推理性能。

该数据集共包含约 130 万条医学视觉问答（VQA）样本，其中 647,031 条为对齐型 VQA，另有 647,031 条为指令微调 VQA 。数据基于 914,960 张经过严格筛选的医学图像及其上下文文本（如标题与文中引用）构建，涵盖多种医学成像模态与解剖区域。每条样本由医学论文中的图像及说明性文字组成，并借助多模态大语言模型（如 GPT-4V）生成对应的图像描述、问题与答案。

数据集示例

PubMedVision2510.torrent

做种 1正在下载 0已完成 7总下载量 78

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

在 Discord 上讨论

日期

4 个月前

大小

2.31 GB

数据集组织

论文 URL

2406.19280

许可证

Apache 2.0

标签

PubMedVision 是由深圳大数据研究院联合香港中文大学（深圳）、国家医疗健康大数据研究院（深圳）于 2024 年发布的一个用于医学多模态能力评估的数据集，相关论文成果为「HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale」，旨在为多模态大语言模型（MLLMs）在医疗视觉 – 文本理解任务方面提供标准化测试资源，以检验它们在医学领域的视觉知识融合与推理性能。

该数据集共包含约 130 万条医学视觉问答（VQA）样本，其中 647,031 条为对齐型 VQA，另有 647,031 条为指令微调 VQA 。数据基于 914,960 张经过严格筛选的医学图像及其上下文文本（如标题与文中引用）构建，涵盖多种医学成像模态与解剖区域。每条样本由医学论文中的图像及说明性文字组成，并借助多模态大语言模型（如 GPT-4V）生成对应的图像描述、问题与答案。

数据集示例

PubMedVision2510.torrent

做种 1正在下载 0已完成 7总下载量 78

PubMedVision2510/
- README.md
  1.94 KB
- README.txt
  3.88 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供