Command Palette

Search for a command to run...

6 个月前

TaskCraft:代理任务的自动化生成

TaskCraft:代理任务的自动化生成

摘要

代理任务(agentic tasks)是指需要自主性、工具使用和适应性推理的多步骤问题解决任务,这些任务在自然语言处理(NLP)和人工智能(AI)的发展中变得越来越重要。然而,现有的指令数据缺乏工具交互,而当前的代理基准测试依赖于昂贵的人工标注,这限制了它们的可扩展性。为此,我们引入了\textsc{TaskCraft},这是一种自动生成具有难度可调、多工具使用和可验证性的代理任务及其执行轨迹的工作流。TaskCraft通过基于深度和宽度的扩展方法来扩展原子任务,从而创建结构上和层次上复杂的挑战。实证结果表明,这些任务在生成工作流中改进了提示优化,并增强了对代理基础模型的监督微调。我们提供了一个大规模的合成数据集,包含约36,000个不同难度的任务,以支持未来关于代理调优和评估的研究。

代码仓库

oppo-personalai/taskcraft
官方
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供