MoniRefer:路側インフラに基づいた3Dビジュアルグラウンディングのための新しいデータセット
Research Paper#Computer Vision, 3D Visual Grounding, Roadside Infrastructure, Multi-modal Learning🔬 Research|分析: 2026年1月3日 08:53•
公開: 2025年12月31日 03:56
•1分で読める
•ArXiv分析
この論文は、路側インフラに特化した3Dビジュアルグラウンディングのための新しいデータセット、MoniReferを紹介しています。既存のデータセットは主に屋内または自己車両の視点に焦点を当てており、より広い、インフラレベルの視点からの交通シーンの理解にはギャップがあるため、これは重要です。データセットの大規模性と現実世界での性質、手動検証が主な強みです。提案された手法であるMoni3DVGは、マルチモーダルデータを利用してオブジェクトのローカリゼーションを改善することにより、この分野に貢献しています。