Paper#llm🔬 Research分析: 2026年1月3日 19:19

大型语言模型在K-12教育中的学习者建模方面存在不足

发布:2025年12月28日 18:26
1分で読める
ArXiv

分析

本文强调了仅使用大型语言模型 (LLM) 进行 K-12 教育中的自适应辅导的局限性,尤其是在评估学生知识的准确性、可靠性和时间一致性方面。它强调了需要结合已建立的学习者建模技术(如深度知识追踪 (DKT))的混合方法,以实现负责任的教育 AI,特别是考虑到欧盟 AI 法将 K-12 设置归类为高风险领域。

引用

DKT 实现了最高的区分性能 (AUC = 0.83),并且在所有设置中始终优于 LLM。LLM 表现出严重的时间弱点,包括不一致和错误方向的更新。