Paper#llm🔬 Research分析: 2026年1月3日 16:23

重新思考微调语言模型在自动漏洞修复中的能力

发布:2025年12月27日 16:12
1分で読める
ArXiv

分析

本文研究了微调语言模型在自动漏洞修复(AVR)中的局限性。它强调了过拟合、非互斥的数据集划分以及基于匹配的评估指标的不足。这项研究的重要性在于它对当前 AVR 技术的批判性评估,以及提出一个新的基准(L-AVRBench)以改进评估和对模型能力的理解。

引用

最先进的模型通常会过度拟合训练集,并且使用训练集、验证集和测试集进行评估,而这些数据集并非互斥。