MoniRefer:路側インフラに基づいた3Dビジュアルグラウンディングのための新しいデータセット

Research Paper#Computer Vision, 3D Visual Grounding, Roadside Infrastructure, Multi-modal Learning🔬 Research|分析: 2026年1月3日 08:53
公開: 2025年12月31日 03:56
1分で読める
ArXiv

分析

この論文は、路側インフラに特化した3Dビジュアルグラウンディングのための新しいデータセット、MoniReferを紹介しています。既存のデータセットは主に屋内または自己車両の視点に焦点を当てており、より広い、インフラレベルの視点からの交通シーンの理解にはギャップがあるため、これは重要です。データセットの大規模性と現実世界での性質、手動検証が主な強みです。提案された手法であるMoni3DVGは、マルチモーダルデータを利用してオブジェクトのローカリゼーションを改善することにより、この分野に貢献しています。
引用・出典
原文を見る
"“...the first real-world large-scale multi-modal dataset for roadside-level 3D visual grounding.”"
A
ArXiv2025年12月31日 03:56
* 著作権法第32条に基づく適法な引用です。