D-GARA:用于真实世界异常中GUI代理鲁棒性的动态基准测试框架Research#llm🔬 Research|分析: 2026年1月4日 07:00•发布: 2025年11月20日 17:43•1分で読める•ArXiv分析本文介绍了D-GARA,一个旨在评估GUI代理在真实世界异常情况下的鲁棒性的框架。 专注于动态基准测试表明,与静态基准测试相比,它试图创建一个更现实和更具挑战性的评估环境。 使用“真实世界异常”意味着该框架考虑了UI意外更改、网络延迟或其他可能影响代理性能的因素。 来源是ArXiv表明这很可能是一篇研究论文。要点•D-GARA是一个用于基准测试GUI代理鲁棒性的框架。•它侧重于动态基准测试以模拟真实世界的情况。•该框架考虑了可能影响代理性能的真实世界异常。引用 / 来源查看原文"D-GARA: A Dynamic Benchmarking Framework for GUI Agent Robustness in Real-World Anomalies"AArXiv2025年11月20日 17:43* 根据版权法第32条进行合法引用。较旧Deep Learning in Clojure from Scratch to GPU: Learning a Regression较新Securing the Model Context Protocol: Defending LLMs Against Tool Poisoning and Adversarial Attacks相关分析Research人类AI检测2026年1月4日 05:47Research侧重于实现的深度学习书籍2026年1月4日 05:49Research个性化 Gemini2026年1月4日 05:49来源: ArXiv