DarkEQA:在低光照室内环境中评估视觉语言模型

Paper#llm🔬 Research|分析: 2026年1月3日 06:16
发布: 2025年12月31日 17:31
1分で読める
ArXiv

分析

本文解决了视觉语言模型(VLM)在具身智能体评估中的一个关键空白。现有的基准测试通常忽略了VLM在低光照条件下的性能,而这对于实际的24/7运行至关重要。DarkEQA提供了一个新的基准测试,用于评估VLM在这些具有挑战性的环境中的鲁棒性,重点关注感知原语,并使用物理上真实的低光照退化模拟。这使得能够更准确地理解VLM的局限性和潜在改进。
引用 / 来源
查看原文
"DarkEQA isolates the perception bottleneck by evaluating question answering from egocentric observations under controlled degradations, enabling attributable robustness analysis."
A
ArXiv2025年12月31日 17:31
* 根据版权法第32条进行合法引用。