大型语言模型在数学辅导中接近专家教学质量,但在教学和语言方面存在差异
分析
本研究论文通过比较大型语言模型(LLM)与专家和新手人类导师的表现,调查了大型语言模型(LLM)在数学辅导中的有效性。该研究侧重于教学策略和语言特征,揭示了LLM达到了与专家相当的教学质量,但采用了不同的方法。具体而言,LLM倾向于较少使用重述和复述技巧,同时生成更长、词汇更多样化和更礼貌的回复。研究结果强调了LLM在教育中的潜力,同时也强调需要进一步改进,使其策略更符合经过验证的人类辅导实践。特定语言特征与感知质量之间的相关性分析为改进基于LLM的辅导系统提供了宝贵的见解。
引用
“我们发现,大型语言模型平均而言接近专家水平的感知教学质量,但在教学和语言方面表现出系统性差异。”