監査可能なスキルグラフ自己改善:エージェント型LLM向け

Paper#llm🔬 Research|分析: 2026年1月3日 16:16
公開: 2025年12月28日 19:39
1分で読める
ArXiv

分析

本論文は、自己改善型エージェントLLMにおける重要なセキュリティとガバナンスの課題に対処しています。監査可能で検証可能な改善を創出することに焦点を当てたフレームワーク、ASG-SIを提案しています。中核となるアイデアは、自己改善を、エージェントを成長するスキルグラフにコンパイルするプロセスとして扱い、各改善が成功した軌跡から抽出され、明確なインターフェースを持つスキルに正規化され、検証者バックエンドのチェックを通じて検証されるようにすることです。このアプローチは、報酬ハッキングや行動のドリフトなどの問題を軽減し、自己改善プロセスをより透明で管理しやすくすることを目指しています。経験合成と継続的なメモリ制御の統合は、フレームワークのスケーラビリティと長期的パフォーマンスをさらに強化します。
引用・出典
原文を見る
"ASG-SI reframes agentic self-improvement as accumulation of verifiable, reusable capabilities, offering a practical path toward reproducible evaluation and operational governance of self-improving AI agents."
A
ArXiv2025年12月28日 19:39
* 著作権法第32条に基づく適法な引用です。