MiniMax M2.1开源:真实世界开发和代理的最新技术
分析
此公告重点介绍了 MiniMax M2.1 的开源,这是一种大型语言模型 (LLM),声称在编码基准测试中具有最先进的性能。该模型的架构是专家混合 (MoE),在总共 2300 亿个参数中具有 100 亿个活动参数。超越 Gemini 3 Pro 和 Claude Sonnet 4.5 的说法意义重大,表明在编码任务中具有竞争优势。开源性质允许社区审查、进一步开发和更广泛的访问,从而可能加速 AI 辅助编码和代理开发方面的进展。但是,独立验证基准测试声明对于验证模型的真实能力至关重要。缺乏关于训练数据和方法的详细信息是一个限制。
要点
引用
“在编码基准测试(SWE / VIBE / Multi-SWE)上达到 SOTA • 击败 Gemini 3 Pro 和 Claude Sonnet 4.5”