MomaGraph: 基于视觉语言模型的具身任务规划新方法

Research #Agent 🔬 Research|分析: 2026年1月10日 09:53•

发布: 2025年12月18日 18:59

•

1分で読める

分析

这项研究通过将状态感知统一场景图与视觉语言模型相结合，探索了一种用于具身任务规划的新方法。这项工作可能通过提高智能体理解和与其环境交互的能力，推动机器人技术和人工智能领域的发展。

引用 / 来源

"The paper leverages Vision-Language Models to create State-Aware Unified Scene Graphs for Embodied Task Planning."

ArXiv2025年12月18日 18:59

* 根据版权法第32条进行合法引用。

SFTok: Enhancing Discrete Tokenizer Performance

Predicting 3D Hand Trajectories from Egocentric Videos