MoniRefer:基于路侧基础设施的3D视觉定位新数据集
Research Paper#Computer Vision, 3D Visual Grounding, Roadside Infrastructure, Multi-modal Learning🔬 Research|分析: 2026年1月3日 08:53•
发布: 2025年12月31日 03:56
•1分で読める
•ArXiv分析
本文介绍了一个新的数据集MoniRefer,用于专门为路侧基础设施设计的3D视觉定位。这很重要,因为现有的数据集主要侧重于室内或自车视角,而忽略了从更广泛的、基础设施级别的角度理解交通场景。该数据集的大规模性和真实世界的性质,加上手动验证,是其主要优势。所提出的方法Moni3DVG通过利用多模态数据来改进目标定位,进一步为该领域做出了贡献。