D-GARA：用于真实世界异常中GUI代理鲁棒性的动态基准测试框架

Research #llm 🔬 Research|分析: 2026年1月4日 07:00•

发布: 2025年11月20日 17:43

•

1分で読める

分析

本文介绍了D-GARA，一个旨在评估GUI代理在真实世界异常情况下的鲁棒性的框架。专注于动态基准测试表明，与静态基准测试相比，它试图创建一个更现实和更具挑战性的评估环境。使用“真实世界异常”意味着该框架考虑了UI意外更改、网络延迟或其他可能影响代理性能的因素。来源是ArXiv表明这很可能是一篇研究论文。

要点

引用 / 来源

查看原文

"D-GARA: A Dynamic Benchmarking Framework for GUI Agent Robustness in Real-World Anomalies"

ArXiv2025年11月20日 17:43

* 根据版权法第32条进行合法引用。

较旧

Deep Learning in Clojure from Scratch to GPU: Learning a Regression

较新

Securing the Model Context Protocol: Defending LLMs Against Tool Poisoning and Adversarial Attacks

D-GARA：用于真实世界异常中GUI代理鲁棒性的动态基准测试框架

分析

要点

相关分析

人类AI检测

侧重于实现的深度学习书籍

个性化 Gemini

📬 获取AI新闻

按类别浏览

热门话题

📬 获取AI新闻

按类别浏览

热门话题