IDT: 物理的に根拠のあるTransformerを用いたマルチビュー固有分解

Research Paper#Computer Vision, Image Processing, Intrinsic Image Decomposition, Transformers🔬 Research|分析: 2026年1月3日 16:01
公開: 2025年12月29日 18:24
1分で読める
ArXiv

分析

この論文は、マルチビュー固有画像分解のための新しいフィードフォワードTransformerベースのフレームワークであるIDTを紹介しています。既存の手法におけるビューの不整合という課題に対し、複数の入力画像を共同で推論することで対処しています。画像を拡散反射、拡散シェーディング、鏡面シェーディングに分解する物理的に根拠のある画像形成モデルの使用は、解釈可能で制御可能な分解を可能にする重要な貢献です。マルチビューの一貫性と光輸送の構造化された因数分解に焦点を当てていることは、この分野における重要な進歩です。
引用・出典
原文を見る
"IDT produces view-consistent intrinsic factors in a single forward pass, without iterative generative sampling."
A
ArXiv2025年12月29日 18:24
* 著作権法第32条に基づく適法な引用です。