HyperAIHyperAI

Command Palette

Search for a command to run...

LongAlign 10K 大模型长上下文对齐数据集

日期

2 年前

大小

392.42 MB

数据集组织

Tsinghua University(清华大学)

标签

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。

在构建过程中,该数据集首先从书籍、百科全书、学术论文、代码等 9 大不同领域汲取素材, 然后运用 Claude 2.1 大模型,在长篇背景之下生成多样化任务与答案。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

LongAlign.torrent
做种 1正在下载 0已完成 286总下载量 459
  • LongAlign/
    • README.md
      1.28 KB
    • README.txt
      2.57 KB
      • data/
        • LongAlign-10k.zip
          392.42 MB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供