Command Palette
Search for a command to run...
Cunxi Yu Rongjian Liang Chia-Tung Ho Haoxing Ren

摘要
大型语言模型(LLMs)近年来展现出强大的代码生成能力,不仅能够实现静态代码生成,还能通过代理框架实现代码的迭代式自演化。近期,AlphaEvolve \cite{novikov2025alphaevolve} 证明了基于 LLM 的代码代理能够自主优化算法,并超越人类专家,但其应用范围仅限于数百行代码规模的孤立核心模块。受 AlphaEvolve 的启发,我们提出了 SATLUTION,这是首个将基于 LLM 的代码演化扩展至完整项目仓库规模的框架,涵盖数百个文件及数万行 C/C++ 代码。针对布尔可满足性问题(SAT)——这一经典的 NP 完全问题,也是理论与应用领域的基石——SATLUTION 通过严格正确性保障与分布式运行时反馈,协调 LLM 代理直接演化求解器项目,同时自主演化自身的演化策略与规则。基于 SAT 竞赛 2024 年的代码库与基准测试,SATLUTION 所演化出的求解器在性能上显著超越了 SAT 竞赛 2025 年人类设计的优胜者,并在 2024 年基准测试中同时超越了 2024 年与 2025 年的冠军。