BOAD: バンディット最適化による階層型ソフトウェアエンジニアリングエージェント

Paper#LLM🔬 Research|分析: 2026年1月3日 18:34
公開: 2025年12月29日 17:41
1分で読める
ArXiv

分析

この論文は、複雑なソフトウェアエンジニアリングタスクにおけるシングルエージェントLLMシステムの限界に対処するため、階層型マルチエージェントアプローチを提案しています。主な貢献は、効果的なサブエージェントの階層を効率的に発見するBandit Optimization for Agent Design (BOAD)フレームワークです。結果は、特に外れ値タスクにおいて、より大きなモデルを上回り、大幅な一般化の改善を示しています。この研究は、現実世界のソフトウェアエンジニアリング向けに、より堅牢で適応性の高いLLMベースのシステムを設計するための、斬新で自動化された方法を提供しているため重要です。
引用・出典
原文を見る
"BOAD outperforms single-agent and manually designed multi-agent systems. On SWE-bench-Live, featuring more recent and out-of-distribution issues, our 36B system ranks second on the leaderboard at the time of evaluation, surpassing larger models such as GPT-4 and Claude."
A
ArXiv2025年12月29日 17:41
* 著作権法第32条に基づく適法な引用です。