面向长时程SWE Agent的上下文管理

Research Paper#Software Engineering, LLMs, Context Management🔬 Research|分析: 2026年1月3日 20:12
发布: 2025年12月26日 17:15
1分で読める
ArXiv

分析

本文解决了基于LLM的代理在执行长期软件工程任务时面临的关键挑战:上下文管理。核心贡献是CAT,一种新的上下文管理范式,它主动将历史轨迹压缩成可操作的摘要。这是一项重大进步,因为它解决了上下文爆炸和语义漂移的问题,这些是代理在复杂、长期交互中性能的主要瓶颈。所提出的CAT-GENERATOR框架和SWE-Compressor模型提供了具体的实现,并在SWE-Bench-Verified基准测试中展示了改进的性能。
引用 / 来源
查看原文
"SWE-Compressor reaches a 57.6% solved rate and significantly outperforms ReAct-based agents and static compression baselines, while maintaining stable and scalable long-horizon reasoning under a bounded context budget."
A
ArXiv2025年12月26日 17:15
* 根据版权法第32条进行合法引用。