本体感觉增强视觉语言模型,用于机器人任务

Research#Robotics🔬 Research|分析: 2026年1月10日 07:51
发布: 2025年12月24日 01:36
1分で読める
ArXiv

分析

这项研究探索了一种新方法,即将本体感觉数据与视觉语言模型相结合,用于机器人应用。 该研究侧重于增强字幕生成和子任务分割,表明了对机器人技术的实用贡献。
引用 / 来源
查看原文
"Proprioception Enhances Vision Language Model in Generating Captions and Subtask Segmentations for Robot Task"
A
ArXiv2025年12月24日 01:36
* 根据版权法第32条进行合法引用。