Paper#LLM🔬 Research分析: 2026年1月3日 18:34

BOAD: 通过Bandit优化发现分层软件工程代理

发布:2025年12月29日 17:41
1分で読める
ArXiv

分析

本文针对单代理LLM系统在复杂软件工程任务中的局限性,提出了一种分层多代理方法。核心贡献是Bandit Optimization for Agent Design (BOAD)框架,该框架能够高效地发现有效的专业子代理层次结构。结果表明,特别是在分布外任务上,泛化能力得到了显著提升,超越了更大的模型。这项工作很重要,因为它提供了一种新颖且自动化的方法,用于设计更强大、更具适应性的基于LLM的系统,以用于实际的软件工程。

引用

BOAD优于单代理和手动设计的多代理系统。在SWE-bench-Live上,该平台具有更新的、分布外的问题,我们的36B系统在评估时排名第二,超越了GPT-4和Claude等更大的模型。