代码LLM中的局部校准不确定性

Research Paper#Large Language Models (LLMs) for Code Generation🔬 Research|分析: 2026年1月3日 09:21
发布: 2025年12月31日 02:00
1分で読める
ArXiv

分析

本文解决了代码生成中LLM输出可靠性的关键问题。通过提供识别潜在问题代码段的方法,它直接支持了LLM在软件开发中的实际应用。 关注校准的不确定性对于使开发人员能够信任和有效地编辑LLM生成的代码至关重要。 对白盒和黑盒方法的比较为实现此目标的不同策略提供了宝贵的见解。 本文的贡献在于其改进LLM在代码生成方面的可用性和可信度的实用方法,这是迈向更可靠的AI辅助软件开发的重要一步。
引用 / 来源
查看原文
"Probes with a small supervisor model can achieve low calibration error and Brier Skill Score of approx 0.2 estimating edited lines on code generated by models many orders of magnitude larger."
A
ArXiv2025年12月31日 02:00
* 根据版权法第32条进行合法引用。