Paper #llm 🔬 Research分析: 2026年1月3日 16:23

重新思考微调语言模型在自动漏洞修复中的能力

发布:2025年12月27日 16:12

•

1分で読める

分析

本文研究了微调语言模型在自动漏洞修复（AVR）中的局限性。它强调了过拟合、非互斥的数据集划分以及基于匹配的评估指标的不足。这项研究的重要性在于它对当前 AVR 技术的批判性评估，以及提出一个新的基准（L-AVRBench）以改进评估和对模型能力的理解。

引用

“最先进的模型通常会过度拟合训练集，并且使用训练集、验证集和测试集进行评估，而这些数据集并非互斥。”

AI progress stalls as OpenAI, Google and Anthropic hit roadblocks

Anthropic signs a $200M deal with the Department of Defense