監査可能なスキルグラフ自己改善:エージェント型LLM向け
分析
本論文は、自己改善型エージェントLLMにおける重要なセキュリティとガバナンスの課題に対処しています。監査可能で検証可能な改善を創出することに焦点を当てたフレームワーク、ASG-SIを提案しています。中核となるアイデアは、自己改善を、エージェントを成長するスキルグラフにコンパイルするプロセスとして扱い、各改善が成功した軌跡から抽出され、明確なインターフェースを持つスキルに正規化され、検証者バックエンドのチェックを通じて検証されるようにすることです。このアプローチは、報酬ハッキングや行動のドリフトなどの問題を軽減し、自己改善プロセスをより透明で管理しやすくすることを目指しています。経験合成と継続的なメモリ制御の統合は、フレームワークのスケーラビリティと長期的パフォーマンスをさらに強化します。