基于LLM的代码生成训练数据优化:一项实证研究Paper#llm🔬 Research|分析: 2026年1月3日 08:55•发布: 2025年12月31日 02:30•1分で読める•ArXiv分析本文通过系统地评估训练数据优化技术,解决了改进基于LLM的代码生成这一关键问题。它之所以重要,是因为它提供了关于不同技术及其组合的有效性的经验证据,为研究人员和实践者提供了实用的指导。这项跨多个基准和LLM的大规模研究增加了论文的可信度和影响力。要点•数据合成是提高功能正确性和减少代码异味最有效的技术。•数据合成与数据重构相结合实现了最强的整体性能。•大多数技术组合不能进一步提高功能正确性,但可以提高代码质量(代码异味和可维护性)。引用 / 来源查看原文"Data synthesis is the most effective technique for improving functional correctness and reducing code smells."AArXiv2025年12月31日 02:30* 根据版权法第32条进行合法引用。较旧Show HN: HN Wrapped 2025 - an LLM reviews your year on HN较新Lm.rs: Minimal CPU LLM inference in Rust with no dependency相关分析Paper基于选择策略的协调人形机器人操作2026年1月3日 06:10Paper从未对齐图像即时进行3D场景编辑2026年1月3日 06:10Paper用于未来预测的LLM预测2026年1月3日 06:10来源: ArXiv