HyperAIHyperAI

Command Palette

Search for a command to run...

Document Haystack 多模态文档基准数据集

日期

6 个月前

大小

14.6 GB

数据集组织

Amazon

论文 URL

2507.15882

Document Haystack 是由 Amazon AGI 于 2025 年发布的一个多模态文档基准数据集,相关论文成果为「Document Haystack: A Long Context Multimodal Image/Document Understanding Vision LLM Benchmark」,旨在评估视觉语言模型(VLM)在长上下文复杂文档中的信息检索与理解能力。

该数据集包含 400 份文档变体和 8,250 个检索问题,涵盖了 5-200 页篇幅的真实文档,数据形式包括原始 PDF 、 200 DPI 分页图像和纯文本解析文件,适用于问答(Question-Answering)和视觉问答(Visual Question-Answering)等任务。

document-haystack.torrent
做种 1正在下载 0已完成 43总下载量 132
  • document-haystack/
    • README.md
      1.38 KB
    • README.txt
      2.76 KB
      • data/
        • document-haystack.zip
          14.6 GB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供