麻省理工研究揭示AI代码迭代的突破性新基准

research#agent📝 Blog|分析: 2026年3月30日 03:17
发布: 2026年3月30日 02:58
1分で読める
钛媒体

分析

麻省理工的研究人员推出了一项革命性的新基准,SlopCodeBench,旨在严格测试AI智能体的长期代码编写能力。该基准模拟真实世界的软件开发,推动AI通过多次迭代和不断发展的需求来适应和完善代码。 这项研究有望大幅改善我们评估和利用AI在软件开发中的方式。
引用 / 来源
查看原文
"SlopCodeBench:一个旨在揭示AI编程智能体缺点的“地狱模式”基准。"
钛媒体2026年3月30日 02:58
* 根据版权法第32条进行合法引用。