Command Palette

Search for a command to run...

3 个月前

WebResearcher:在长时程Agent中释放无边界推理能力

WebResearcher:在长时程Agent中释放无边界推理能力

摘要

近年来,深度研究系统取得的进展表明,人工智能代理(AI agents)具备从外部来源自主发现并合成知识的潜力。本文提出了一种名为 WebResearcher 的新型框架,用于构建此类智能代理,其核心包含两个关键组件:(1)WebResearcher,一种迭代式深度研究范式,将深度研究过程重构为马尔可夫决策过程(Markov Decision Process),在此过程中,智能代理可周期性地将研究成果整合进动态演进的研究报告中,同时保持专注的工作空间,从而有效克服现有单上下文方法普遍面临的上下文过载与噪声干扰问题;(2)WebFrontier,一个可扩展的数据合成引擎,通过工具增强的复杂度递进机制生成高质量训练数据,从而系统化地构建研究任务,弥合被动知识回忆与主动知识建构之间的鸿沟。值得注意的是,我们发现该范式生成的训练数据显著提升了传统单上下文方法在工具使用能力方面的表现。此外,该范式可通过并行思维自然扩展,支持多智能体并发探索,从而获得更全面的结论。在六个具有挑战性的基准测试中进行的大量实验表明,WebResearcher 实现了当前最优的性能,甚至超越了前沿的专有系统。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
WebResearcher:在长时程Agent中释放无边界推理能力 | 论文 | HyperAI超神经