分析
本文探讨了关于 AI 生成代码可靠性的关键问题。它研究了由 LLM 生成的代码的可复现性,这是软件开发的关键因素。该研究侧重于依赖管理,并引入了三层框架,为评估 LLM 生成代码的实际可用性提供了有价值的方法。研究结果突出了在实现可复现结果方面存在的重大挑战,强调了改进 LLM 编码代理和依赖处理的必要性。
要点
引用
“只有 68.3% 的项目可以开箱即用,并且在不同语言之间存在很大差异(Python 89.2%,Java 44.0%)。我们还发现,从声明的依赖关系到实际的运行时依赖关系,平均扩展了 13.5 倍,揭示了重要的隐藏依赖关系。”