透明オブジェクト認識のための拡散モデル

Research Paper#Computer Vision, Diffusion Models, Transparent Object Perception🔬 Research|分析: 2026年1月3日 17:00
公開: 2025年12月29日 18:59
1分で読める
ArXiv

分析

本論文は、コンピュータビジョンにとって非常に難しい問題である透明オブジェクトの深度と法線推定に対する新しいアプローチを紹介しています。著者は、透明な材料との光の相互作用の物理学を暗黙的に理解しているビデオ拡散モデルの生成能力を活用しています。彼らは合成データセット(TransPhy3D)を作成し、ビデオからビデオへの翻訳者を訓練し、いくつかのベンチマークで最先端の結果を達成しました。この研究は、困難な知覚タスクに生成モデルを再利用する可能性を示し、ロボットの把持などの現実世界のアプリケーションのための実用的なソリューションを提供するため、重要です。
引用・出典
原文を見る
""Diffusion knows transparency." Generative video priors can be repurposed, efficiently and label-free, into robust, temporally coherent perception for challenging real-world manipulation."
A
ArXiv2025年12月29日 18:59
* 著作権法第32条に基づく適法な引用です。