BOAD: 通过Bandit优化发现分层软件工程代理

Paper#LLM🔬 Research|分析: 2026年1月3日 18:34
发布: 2025年12月29日 17:41
1分で読める
ArXiv

分析

本文针对单代理LLM系统在复杂软件工程任务中的局限性,提出了一种分层多代理方法。核心贡献是Bandit Optimization for Agent Design (BOAD)框架,该框架能够高效地发现有效的专业子代理层次结构。结果表明,特别是在分布外任务上,泛化能力得到了显著提升,超越了更大的模型。这项工作很重要,因为它提供了一种新颖且自动化的方法,用于设计更强大、更具适应性的基于LLM的系统,以用于实际的软件工程。
引用 / 来源
查看原文
"BOAD outperforms single-agent and manually designed multi-agent systems. On SWE-bench-Live, featuring more recent and out-of-distribution issues, our 36B system ranks second on the leaderboard at the time of evaluation, surpassing larger models such as GPT-4 and Claude."
A
ArXiv2025年12月29日 17:41
* 根据版权法第32条进行合法引用。