Command Palette

Search for a command to run...

Quora Duplicate Questions 文本分类研究数据集

日期

3 年前

大小

55.48 MB

机构

Quora

发布地址

data.quora.com

Quora Duplicate Questions Dataset 是用于判别文本中问题对是否重复的数据集,其被用于文本分类研究,旨在为任何人提供训练和测试语义等效模型的机会。

该数据集由超过 400,000 行潜在问题重复对组成,每行包含问题的 ID 、问题的完整文本以及指示该行是否包含重复对的二进制值。

该数据集由 Quora 团队于 2017 年发布,主要发布人有 Shankar Iyer 、 Nikhil Dandekar 和 Kornél Csernai 。

quora_duplicate_questions.torrent
做种 3正在下载 0已完成 816总下载次数 1,486
  • quora_duplicate_questions/
    • README.md
      1.15 KB
    • README.txt
      2.29 KB
      • data/
        • quora_duplicate_questions.tsv
          55.48 MB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供