大型语言模型在K-12教育中的学习者建模方面存在不足Paper#llm🔬 Research|分析: 2026年1月3日 19:19•发布: 2025年12月28日 18:26•1分で読める•ArXiv分析本文强调了仅使用大型语言模型 (LLM) 进行 K-12 教育中的自适应辅导的局限性,尤其是在评估学生知识的准确性、可靠性和时间一致性方面。它强调了需要结合已建立的学习者建模技术(如深度知识追踪 (DKT))的混合方法,以实现负责任的教育 AI,特别是考虑到欧盟 AI 法将 K-12 设置归类为高风险领域。要点•在 K-12 教育中评估学生知识方面,单独使用 LLM 不如已建立的学习者建模技术(例如 DKT)有效。•LLM 在时间一致性方面存在困难,并产生不一致的掌握更新。•负责任的辅导需要将 LLM 与学习者建模相结合的混合框架。•微调 LLM 可以提高性能,但仍然不如 DKT,并且需要大量的计算资源。引用 / 来源查看原文"DKT achieves the highest discrimination performance (AUC = 0.83) and consistently outperforms the LLM across settings. LLMs exhibit substantial temporal weaknesses, including inconsistent and wrong-direction updates."AArXiv2025年12月28日 18:26* 根据版权法第32条进行合法引用。较旧Using a rare event sampling technique to quantify extreme El Niño event statistics较新Interpretable Gallbladder Ultrasound Diagnosis: A Lightweight Web-Mobile Software Platform with Real-Time XAI相关分析Paper基于选择策略的协调人形机器人操作2026年1月3日 06:10Paper从未对齐图像即时进行3D场景编辑2026年1月3日 06:10Paper用于未来预测的LLM预测2026年1月3日 06:10来源: ArXiv