基于LLM的代码生成训练数据优化：一项实证研究

Paper #llm 🔬 Research|分析: 2026年1月3日 08:55•

发布: 2025年12月31日 02:30

•

1分で読める

分析

本文通过系统地评估训练数据优化技术，解决了改进基于LLM的代码生成这一关键问题。它之所以重要，是因为它提供了关于不同技术及其组合的有效性的经验证据，为研究人员和实践者提供了实用的指导。这项跨多个基准和LLM的大规模研究增加了论文的可信度和影响力。

引用 / 来源

"Data synthesis is the most effective technique for improving functional correctness and reducing code smells."

ArXiv2025年12月31日 02:30

* 根据版权法第32条进行合法引用。

Show HN: HN Wrapped 2025 - an LLM reviews your year on HN

Lm.rs: Minimal CPU LLM inference in Rust with no dependency