Windsurf 发布 Arena Mode:在你的代码库中对战 LLM!product#llm📝 Blog|分析: 2026年2月14日 07:15•发布: 2026年2月14日 15:00•1分で読める•InfoQ中国分析Windsurf 的 Arena Mode 是一个变革者,它允许开发人员在实际编码任务期间,在其集成开发环境 (IDE) 中直接比较多个大语言模型 (LLM)。这种创新方法承诺比传统的基准测试更真实、更相关的评估,为模型在不同场景中的性能提供宝贵的见解。Plan Mode 的加入通过专注于代码生成前的规划,进一步增强了开发者的体验。要点•Arena Mode 使开发人员能够在他们的编码工作流程中直接评估 LLM,使用他们自己的代码库。•该系统允许并排比较 LLM 响应,用户投票决定性能。•Windsurf 计划通过更多模型和功能来扩展 Arena Mode,包括特定任务的排行榜。引用 / 来源查看原文"Windsurf 在其 IDE 中推出了 Arena Mode,该模式支持开发者在处理实际编码任务时并行对比多款大语言模型 (LLM)。"IInfoQ中国2026年2月14日 15:00* 根据版权法第32条进行合法引用。较旧Unveiling the Secrets of Machine Learning System Design较新Managing Life with AI: A Revolutionary Approach Beyond Note-Taking相关分析product革新AI代码生成:使用Claude Code掌握规范驱动开发2026年4月2日 01:15productPendo 的 Novus:了解您的代码的 AI 驱动产品经理2026年4月2日 01:00productGenspark:革新工作空间的AI智能体2026年4月2日 00:47来源: InfoQ中国