麻省理工研究揭示AI代码迭代的突破性新基准

research #agent 📝 Blog|分析: 2026年3月30日 03:17•

发布: 2026年3月30日 02:58

•

1分で読める

分析

麻省理工的研究人员推出了一项革命性的新基准，SlopCodeBench，旨在严格测试AI智能体的长期代码编写能力。该基准模拟真实世界的软件开发，推动AI通过多次迭代和不断发展的需求来适应和完善代码。这项研究有望大幅改善我们评估和利用AI在软件开发中的方式。

引用 / 来源

"SlopCodeBench：一个旨在揭示AI编程智能体缺点的“地狱模式”基准。"

钛

钛媒体2026年3月30日 02:58

* 根据版权法第32条进行合法引用。

Anthropic Teases 'Claude Mythos': A Leap Forward in Generative AI Performance!

Claude Code's MEMORY.md: Revolutionizing AI Project Memory