D-GARA:用于真实世界异常中GUI代理鲁棒性的动态基准测试框架

Research#llm🔬 Research|分析: 2026年1月4日 07:00
发布: 2025年11月20日 17:43
1分で読める
ArXiv

分析

本文介绍了D-GARA,一个旨在评估GUI代理在真实世界异常情况下的鲁棒性的框架。 专注于动态基准测试表明,与静态基准测试相比,它试图创建一个更现实和更具挑战性的评估环境。 使用“真实世界异常”意味着该框架考虑了UI意外更改、网络延迟或其他可能影响代理性能的因素。 来源是ArXiv表明这很可能是一篇研究论文。
引用 / 来源
查看原文
"D-GARA: A Dynamic Benchmarking Framework for GUI Agent Robustness in Real-World Anomalies"
A
ArXiv2025年11月20日 17:43
* 根据版权法第32条进行合法引用。