OpenGround: 开放世界3D视觉定位

分析

本文介绍了OpenGround,一个用于3D视觉定位的新框架,通过实现零样本学习和处理开放世界场景来解决现有方法的局限性。核心创新是基于主动认知的推理(ACR)模块,该模块动态扩展了模型的认知范围。本文的意义在于它能够处理未定义或未知的目标,使其适用于更多样化和更真实的3D场景理解任务。OpenTarget数据集的引入通过提供一个用于评估开放世界定位性能的基准,进一步促进了该领域的发展。
引用 / 来源
查看原文
"The Active Cognition-based Reasoning (ACR) module performs human-like perception of the target via a cognitive task chain and actively reasons about contextually relevant objects, thereby extending VLM cognition through a dynamically updated OLT."
A
ArXiv2025年12月28日 17:44
* 根据版权法第32条进行合法引用。