网络代理说服基准

发布: 2025年12月29日 01:09

•

1分で読める

分析

本文介绍了一个基准（TRAP），用于评估网络代理（由 LLM 驱动）对提示注入攻击的脆弱性。随着网络代理变得越来越普遍，这突出了一个关键的安全问题，表明这些代理很容易被嵌入在网络界面中的对抗性指令误导。这项研究提供了一个用于进一步调查和扩展基准的框架，这对于开发更强大和更安全的网络代理至关重要。

引用 / 来源

"Agents are susceptible to prompt injection in 25% of tasks on average (13% for GPT-5 to 43% for DeepSeek-R1)."

ArXiv2025年12月29日 01:09

* 根据版权法第32条进行合法引用。

Survey on Lattice Gas Models on 2D Lattices: Critical Behavior of Closed Trajectories

The Geometric Foundations of Microcanonical Thermodynamics: Entropy Flow Equation and Thermodynamic Equivalence