网络代理说服基准

Research Paper#AI Security, Web Agents, Prompt Injection🔬 Research|分析: 2026年1月3日 19:11
发布: 2025年12月29日 01:09
1分で読める
ArXiv

分析

本文介绍了一个基准(TRAP),用于评估网络代理(由 LLM 驱动)对提示注入攻击的脆弱性。随着网络代理变得越来越普遍,这突出了一个关键的安全问题,表明这些代理很容易被嵌入在网络界面中的对抗性指令误导。这项研究提供了一个用于进一步调查和扩展基准的框架,这对于开发更强大和更安全的网络代理至关重要。
引用 / 来源
查看原文
"Agents are susceptible to prompt injection in 25% of tasks on average (13% for GPT-5 to 43% for DeepSeek-R1)."
A
ArXiv2025年12月29日 01:09
* 根据版权法第32条进行合法引用。