SWE-Bench++:基于开源存储库的可扩展软件工程基准测试框架

Research#Benchmarking🔬 Research|分析: 2026年1月10日 09:40
发布: 2025年12月19日 10:16
1分で読める
ArXiv

分析

这篇研究文章介绍了 SWE-Bench++,一个用于生成软件工程基准测试的框架,解决了对可扩展评估方法的需求。 专注于开源存储库表明了对该领域可重复和可访问的评估数据集的承诺。
引用 / 来源
查看原文
"The article discusses the framework's scalability for generating software engineering benchmarks."
A
ArXiv2025年12月19日 10:16
* 根据版权法第32条进行合法引用。