HyperAIHyperAI

Command Palette

Search for a command to run...

GenExam 多学科文生图考试基准数据集

日期

4 个月前

大小

276.88 MB

数据集组织

Tsinghua University(清华大学)
上海交通大学
上海人工智能实验室

论文 URL

2509.14232

许可证

MIT

GenExam 是由上海人工智能实验室联合上海交通大学、清华大学等机构于 2025 年发布的首个多学科文本到图像的考试风格基准数据集,相关的论文成果为「GenExam: A Multidisciplinary Text-to-Image Exam」,旨在检验模型是否能够整合理解、推理与生成能力,从而真正解决绘图类问题。

该数据集包含约 1,000 个高质量样本,覆盖数学、物理、化学、生物、计算机科学、工程学、医学、艺术、地理与历史等 10 个学科。每个样本均包含多样且具有挑战性的提示语(prompt)、对应的地面真值图像(ground-truth image),并配备细粒度的评分点(scoring points),全面体现真实考试的严谨性与难度。该数据集的构建分为四个阶段:从约 40,000 张图像出发,经 GPT-5 自动筛选与提示生成,再由博士级专家严格审校,最终沉淀为上述 1,000 个多学科样本。

数据集示例

GenExam.torrent
做种 1正在下载 0已完成 10总下载量 90
  • GenExam/
    • README.md
      1.83 KB
    • README.txt
      3.65 KB
      • data/
        • GenExam.zip
          276.88 MB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供