Agent2World:通过多智能体反馈生成符号世界模型

Research Paper#AI, LLM, World Models, Multi-Agent Systems🔬 Research|分析: 2026年1月3日 20:10
发布: 2025年12月26日 18:54
1分で読める
ArXiv

分析

本文解决了训练LLM生成符号世界模型的挑战,这对于基于模型的规划至关重要。缺乏大规模可验证的监督是一个关键的限制。Agent2World通过引入一个多智能体框架来解决这个问题,该框架利用网络搜索、模型开发和自适应测试来生成和完善世界模型。使用多智能体反馈进行推理和微调是一项重大贡献,从而提高了性能并为监督学习提供了数据引擎。本文对行为感知验证和迭代改进的关注是一项值得注意的进步。
引用 / 来源
查看原文
"Agent2World demonstrates superior inference-time performance across three benchmarks spanning both Planning Domain Definition Language (PDDL) and executable code representations, achieving consistent state-of-the-art results."
A
ArXiv2025年12月26日 18:54
* 根据版权法第32条进行合法引用。