AdvJudge-Zero：对抗性 Token 操纵 LLM 判断

Research #LLM 🔬 Research|分析: 2026年1月10日 09:41•

发布: 2025年12月19日 09:22

•

1分で読める

分析

这项研究探讨了 LLM 的一个漏洞，展示了使用对抗性控制 Token 操纵其二进制决策的能力。这对于需要可信判断的应用程序中 LLM 的可靠性具有重要意义。

引用 / 来源

"The study is sourced from ArXiv."

ArXiv2025年12月19日 09:22

* 根据版权法第32条进行合法引用。

SALSA: Advancing Local Smoothness Analysis with Sobolev Algorithm

Dialectical Approaches to Artificial Intelligence