研究显示,大语言模型在简单的计数任务上表现不佳

Research#LLMs🔬 Research|分析: 2026年1月26日 11:42
发布: 2025年12月4日 12:10
1分で読める
ArXiv

分析

这项研究深入探讨了大型语言模型 (LLM) 在执行顺序枚举方面的基本局限性,这是基于规则的系统的基本技能。该研究调查了各种 LLM 的计数能力,揭示了虽然一些 LLM 在明确提示时可以计数,但它们无法自发地进行计数,突显了神经方法和符号方法之间的差距。
引用 / 来源
查看原文
"We find that some LLMs are indeed capable of deploying counting procedures when explicitly prompted to do so, but none of them spontaneously engage in counting when simply asked to enumerate the number of items in a sequence."
A
ArXiv2025年12月4日 12:10
* 根据版权法第32条进行合法引用。