审计技能图自改进:面向智能体LLM

Paper#llm🔬 Research|分析: 2026年1月3日 16:16
发布: 2025年12月28日 19:39
1分で読める
ArXiv

分析

本文解决了自改进智能体LLM中的关键安全和治理挑战。它提出了一个框架ASG-SI,重点在于创建可审计和可验证的改进。核心思想是将自改进视为将智能体编译成不断增长的技能图的过程,确保每次改进都从成功的轨迹中提取,规范化为具有清晰接口的技能,并通过验证器支持的检查进行验证。这种方法旨在缓解奖励黑客和行为漂移等问题,使自改进过程更加透明和可管理。经验合成和持续内存控制的集成进一步增强了框架的可扩展性和长期性能。
引用 / 来源
查看原文
"ASG-SI reframes agentic self-improvement as accumulation of verifiable, reusable capabilities, offering a practical path toward reproducible evaluation and operational governance of self-improving AI agents."
A
ArXiv2025年12月28日 19:39
* 根据版权法第32条进行合法引用。