AdvJudge-Zero:对抗性 Token 操纵 LLM 判断

Research#LLM🔬 Research|分析: 2026年1月10日 09:41
发布: 2025年12月19日 09:22
1分で読める
ArXiv

分析

这项研究探讨了 LLM 的一个漏洞,展示了使用对抗性控制 Token 操纵其二进制决策的能力。这对于需要可信判断的应用程序中 LLM 的可靠性具有重要意义。
引用 / 来源
查看原文
"The study is sourced from ArXiv."
A
ArXiv2025年12月19日 09:22
* 根据版权法第32条进行合法引用。