ABBEL: 言語で表現された信念ボトルネックを通じて行動するLLMエージェント

Research#llm🔬 Research|分析: 2025年12月25日 02:28
公開: 2025年12月24日 05:00
1分で読める
ArXiv NLP

分析

このArXiv論文では、ABBELという、逐次的意思決定タスクにおいてLLMエージェントが簡潔なコンテキストを維持するためのフレームワークを紹介しています。タスク関連の未知数に関する自然言語の要約である信念状態を使用することで、完全なインタラクション履歴を保持することの計算上の非現実性に対処します。エージェントは各ステップで信念を更新し、事後信念に基づいて行動します。ABBELは解釈可能な信念と一定のメモリ使用量を提供しますが、エラー伝播が発生しやすいです。著者らは、信念の生成と行動を改善するために強化学習を使用することを提案し、信念のグレーディングと長さのペナルティを実験しています。この研究は、メモリ効率と信念更新エラーによる潜在的なパフォーマンス低下の間のトレードオフを強調しており、RLを有望なソリューションとして示唆しています。
引用・出典
原文を見る
"ABBEL replaces long multi-step interaction history by a belief state, i.e., a natural language summary of what has been discovered about task-relevant unknowns."
A
ArXiv NLP2025年12月24日 05:00
* 著作権法第32条に基づく適法な引用です。