用于透明物体感知的扩散模型

Research Paper#Computer Vision, Diffusion Models, Transparent Object Perception🔬 Research|分析: 2026年1月3日 17:00
发布: 2025年12月29日 18:59
1分で読める
ArXiv

分析

本文介绍了一种用于透明物体深度和法线估计的新方法,这对于计算机视觉来说是一个非常困难的问题。作者利用了视频扩散模型的生成能力,这些模型隐式地理解了光与透明材料相互作用的物理学。他们创建了一个合成数据集(TransPhy3D)来训练一个视频到视频的翻译器,并在几个基准测试中取得了最先进的结果。这项工作意义重大,因为它展示了将生成模型重新用于具有挑战性的感知任务的潜力,并为机器人抓取等现实世界的应用提供了实用的解决方案。
引用 / 来源
查看原文
""Diffusion knows transparency." Generative video priors can be repurposed, efficiently and label-free, into robust, temporally coherent perception for challenging real-world manipulation."
A
ArXiv2025年12月29日 18:59
* 根据版权法第32条进行合法引用。