OpenGround: 开放世界3D视觉定位
Research Paper#3D Visual Grounding, Zero-Shot Learning, Open-World Learning, Computer Vision, Artificial Intelligence🔬 Research|分析: 2026年1月3日 19:20•
发布: 2025年12月28日 17:44
•1分で読める
•ArXiv分析
本文介绍了OpenGround,一个用于3D视觉定位的新框架,通过实现零样本学习和处理开放世界场景来解决现有方法的局限性。核心创新是基于主动认知的推理(ACR)模块,该模块动态扩展了模型的认知范围。本文的意义在于它能够处理未定义或未知的目标,使其适用于更多样化和更真实的3D场景理解任务。OpenTarget数据集的引入通过提供一个用于评估开放世界定位性能的基准,进一步促进了该领域的发展。
要点
引用 / 来源
查看原文"The Active Cognition-based Reasoning (ACR) module performs human-like perception of the target via a cognitive task chain and actively reasons about contextually relevant objects, thereby extending VLM cognition through a dynamically updated OLT."