HyperAIHyperAI

Command Palette

Search for a command to run...

M2RAG 多模态评估基准数据集

日期

9 个月前

大小

5.46 GB

数据集组织

论文 URL

arxiv.org

标签

M2RAG 是一个用于评估多模态大语言模型 (MLLMs) 在多模态检索场景下的能力的多模态数据集,旨在评估 MLLMs 在图像描述、多模态问答、事实验证和图像重排序等任务中利用多模态检索文档知识能力。相关论文成果为「Benchmarking Retrieval-Augmented Generation in Multi-Modal Contexts」。

该数据集将图像和文本数据相结合,模拟真实场景中的信息检索与生成任务,例如新闻事件分析、视觉问答等,着重评估 MLLMs 在多模态上下文中利用检索文档知识的能力,包括对图像内容的理解、图文关联推理以及事实判断等方面。

M2RAG 基准测试任务示例
M2RAG.torrent
做种 1正在下载 0已完成 105总下载量 190
  • M2RAG/
    • README.md
      1.45 KB
    • README.txt
      2.9 KB
      • data/
        • M2RAG.zip
          5.46 GB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供