HyperAIHyperAI

Command Palette

Search for a command to run...

DocBank 文本数据集

日期

3 年前

大小

48.1 GB

数据集组织

北京航空航天大学

发布 URL

github.com

论文 URL

arxiv.org

Featured Image

DocBank 是一个文本数据集。数据集包含 50 万个细粒度、词条级别标注的文档页面,用于文档布局分析。数据集使用一种简单而有效的方式构建,有 arXiv.com 上提供的 \LaTeX{} 文档的弱监督。

DocBank.torrent
做种 1正在下载 0已完成 444总下载量 786
  • DocBank/
    • README.md
      967 字节
    • README.txt
      1.89 KB
      • data/
        • DocBank_500K_ori_img.zip.001
          5 GB
        • DocBank_500K_ori_img.zip.002
          10 GB
        • DocBank_500K_ori_img.zip.003
          15 GB
        • DocBank_500K_ori_img.zip.004
          20 GB
        • DocBank_500K_ori_img.zip.005
          25 GB
        • DocBank_500K_ori_img.zip.006
          30 GB
        • DocBank_500K_ori_img.zip.007
          35 GB
        • DocBank_500K_ori_img.zip.008
          40 GB
        • DocBank_500K_ori_img.zip.009
          45 GB
        • DocBank_500K_ori_img.zip.010
          47.41 GB
        • DocBank_500K_txt.zip
          47.9 GB
        • MSCOCO_Format_Annotation.zip
          48.1 GB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供