Paper#llm🔬 Research分析: 2026年1月3日 16:23

ファインチューニングされた言語モデルによる脆弱性修復の再考

公開:2025年12月27日 16:12
1分で読める
ArXiv

分析

本論文は、ファインチューニングされた言語モデルを用いた自動脆弱性修復(AVR)の限界を調査しています。過学習、相互に排他的でないデータセット分割、およびマッチベースの評価指標の不適切さを指摘しています。この研究の重要性は、現在のAVR技術に対する批判的な評価と、評価とモデルの能力の理解を深めるための新しいベンチマーク(L-AVRBench)の提案にあります。

参照

最先端のモデルは、多くの場合、トレーニングセットに過学習し、トレーニング、検証、およびテストセットが相互に排他的でない状態で評価されます。