QWEN 3.5 展示惊人空间推理能力,媲美顶级LLM!
分析
MineBench 基准测试揭示了 QWEN 3.5 的非凡改进,某些版本甚至达到了 Opus 和 GPT-5 等行业领先者的水平。 这一进展表明大型语言模型在空间推理能力方面取得了重大进步,为更复杂的 AI 应用铺平了道路。
要点
引用 / 来源
查看原文"说实话,这是一个非常疯狂的改进,QWEN 3.5 甚至有一些构建版本接近(如果不是更好)Opus 4.6/GPT-5.2/Gemini 3 Pro。"
"说实话,这是一个非常疯狂的改进,QWEN 3.5 甚至有一些构建版本接近(如果不是更好)Opus 4.6/GPT-5.2/Gemini 3 Pro。"