LLM 拒绝不一致性:探究随机性和安全性之间的影响

Safety#LLM🔬 Research|分析: 2026年1月10日 11:38
发布: 2025年12月12日 22:29
1分で読める
ArXiv

分析

本文强调了大型语言模型的一个关键漏洞:其拒绝行为的不可预测性。这项研究强调了在评估和部署 LLM 安全机制时采用严格测试方法的重要性。
引用 / 来源
查看原文
"The study analyzes how random seeds and temperature settings impact LLM's propensity to refuse potentially harmful prompts."
A
ArXiv2025年12月12日 22:29
* 根据版权法第32条进行合法引用。