LLM中的涌现行为是幻觉吗?与 Sanmi Koyejo - #671
分析
这篇文章总结了与斯坦福大学助理教授 Sanmi Koyejo 的讨论,重点关注他在 NeurIPS 2024 上发表的研究。主要话题围绕着 Koyejo 的论文,该论文质疑大型语言模型 (LLM) 的“涌现能力”。核心论点是,LLM 中突然获得能力的感知,例如算术技能,可能是一种幻觉,由非线性评估指标的使用引起。相比之下,线性指标显示出更渐进和预期的改进。 讨论还涉及 Koyejo 关于评估 GPT 模型可信度的工作,包括毒性、隐私、公平性和鲁棒性等方面。
引用 / 来源
查看原文"Sanmi describes how evaluating model performance using nonlinear metrics can lead to the illusion that the model is rapidly gaining new capabilities, whereas linear metrics show smooth improvement as expected, casting doubt on the significance of emergence."