GPT-5.5在扩展版纽约时报连线基准测试中强势超越对手夺得第二名
分析
最新的扩展版纽约时报连线基准测试结果展示了大语言模型 (LLM) 能力的令人振奋的进步,GPT-5.5在逻辑推理和谜题解决方面表现出显著的提升。Kimi K2.6一跃成为顶尖开源模型,凸显了尖端人工智能的快速普及。与此同时,DeepSeek V4 Pro的分数大幅飙升,标志着整个AI行业正处于一个极具竞争力和创新活力的格局中。
关键要点
引用 / 来源
查看原文"GPT-5.5超越了GPT-5.4并击败了Opus 4.6,在扩展版纽约时报连线基准测试中仅次于Gemini 3.1 Pro夺得第二名"