OpenGround: オープンワールド3Dビジュアルグラウンディング

分析

本論文は、既存手法の限界を克服し、ゼロショット学習とオープンワールドシナリオを可能にする3Dビジュアルグラウンディングの新しいフレームワーク、OpenGroundを紹介しています。中核的な革新は、モデルの認知範囲を動的に拡張するActive Cognition-based Reasoning (ACR)モジュールです。本論文の重要性は、未定義または予期しないターゲットを処理できることにあり、より多様で現実的な3Dシーン理解タスクに適用できます。OpenTargetデータセットの導入は、オープンワールドグラウンディングのパフォーマンスを評価するためのベンチマークを提供することにより、この分野に貢献しています。
引用・出典
原文を見る
"The Active Cognition-based Reasoning (ACR) module performs human-like perception of the target via a cognitive task chain and actively reasons about contextually relevant objects, thereby extending VLM cognition through a dynamically updated OLT."
A
ArXiv2025年12月28日 17:44
* 著作権法第32条に基づく適法な引用です。