DeepSeek V4 有望重塑 AI 编码性能research#llm📝 Blog|分析: 2026年2月15日 20:33•发布: 2026年2月15日 19:49•1分で読める•r/singularity分析DeepSeek V4 的泄露基准测试分数表明其编码能力实现了巨大飞跃,可能超越所有现有的 大语言模型 (LLM)。 在各种基准测试中令人印象深刻的表现表明了 生成式人工智能 领域的重大进步。要点•DeepSeek V4 在 SWE-Bench Verified 上获得了 83.7%,使其可能成为最佳编码模型。•该模型在编码之外的领域也表现出色,包括数学和推理。•泄露的结果表明 DeepSeek V4 正在超越 GPT 5.2 和 Gemini 3.0 Pro 等竞争对手。引用 / 来源查看原文"如果这些数字是真的,DeepSeek V4 就要重置排行榜了。"Rr/singularity2026年2月15日 19:49* 根据版权法第32条进行合法引用。较旧Boosting Business with Generative AI: The Power of Metadata较新Excitement Builds Around Generative AI Developments相关分析research革新AI评估:为多轮智能体模拟真实用户2026年4月2日 18:00research麻省理工学院研究:人工智能对就业的影响将是上升的浪潮,而非崩溃的巨浪!2026年4月2日 18:00research在“无GPU”笔记本电脑上使用 LLM 构建本地 AI 智能体2026年4月2日 08:15来源: r/singularity