OpenGround: オープンワールド3Dビジュアルグラウンディング
Research Paper#3D Visual Grounding, Zero-Shot Learning, Open-World Learning, Computer Vision, Artificial Intelligence🔬 Research|分析: 2026年1月3日 19:20•
公開: 2025年12月28日 17:44
•1分で読める
•ArXiv分析
本論文は、既存手法の限界を克服し、ゼロショット学習とオープンワールドシナリオを可能にする3Dビジュアルグラウンディングの新しいフレームワーク、OpenGroundを紹介しています。中核的な革新は、モデルの認知範囲を動的に拡張するActive Cognition-based Reasoning (ACR)モジュールです。本論文の重要性は、未定義または予期しないターゲットを処理できることにあり、より多様で現実的な3Dシーン理解タスクに適用できます。OpenTargetデータセットの導入は、オープンワールドグラウンディングのパフォーマンスを評価するためのベンチマークを提供することにより、この分野に貢献しています。
重要ポイント
引用・出典
原文を見る"The Active Cognition-based Reasoning (ACR) module performs human-like perception of the target via a cognitive task chain and actively reasons about contextually relevant objects, thereby extending VLM cognition through a dynamically updated OLT."