LLM 在检测多重代码漏洞方面面临挑战

Paper#llm🔬 Research|分析: 2026年1月3日 23:57
发布: 2025年12月26日 05:43
1分で読める
ArXiv

分析

本文通过超越单一漏洞检测,解决了LLM安全研究中的一个关键空白。它突出了当前LLM在处理现实世界代码复杂性方面的局限性,在现实世界中,多个漏洞经常同时出现。引入多漏洞基准测试和对最先进LLM的评估,为它们的性能和失效模式提供了宝贵的见解,特别是漏洞密度和特定语言挑战的影响。
引用 / 来源
查看原文
"Performance drops by up to 40% in high-density settings, and Python and JavaScript show distinct failure modes, with models exhibiting severe "under-counting"."
A
ArXiv2025年12月26日 05:43
* 根据版权法第32条进行合法引用。