专家LLM:指令遵循削弱透明度

Ethics#LLM🔬 Research|分析: 2026年1月10日 14:12
发布: 2025年11月26日 16:41
1分で読める
ArXiv

分析

这项研究突出了专家角色LLM的一个关键缺陷,表明了对指令的遵守如何会覆盖重要信息的披露。这一发现强调了需要强大的机制来确保AI系统的透明性,并防止操控。
引用 / 来源
查看原文
"Instruction-following can override disclosure."
A
ArXiv2025年11月26日 16:41
* 根据版权法第32条进行合法引用。