大型语言模型在K-12教育中的学习者建模方面存在不足

Paper#llm🔬 Research|分析: 2026年1月3日 19:19
发布: 2025年12月28日 18:26
1分で読める
ArXiv

分析

本文强调了仅使用大型语言模型 (LLM) 进行 K-12 教育中的自适应辅导的局限性,尤其是在评估学生知识的准确性、可靠性和时间一致性方面。它强调了需要结合已建立的学习者建模技术(如深度知识追踪 (DKT))的混合方法,以实现负责任的教育 AI,特别是考虑到欧盟 AI 法将 K-12 设置归类为高风险领域。
引用 / 来源
查看原文
"DKT achieves the highest discrimination performance (AUC = 0.83) and consistently outperforms the LLM across settings. LLMs exhibit substantial temporal weaknesses, including inconsistent and wrong-direction updates."
A
ArXiv2025年12月28日 18:26
* 根据版权法第32条进行合法引用。