Liquid AI的LFM2-2.6B-Exp模型在GPQA中达到42%,性能优于更大的模型
分析
此公告突出了Liquid AI的LFM2-2.6B-Exp模型的卓越能力,尤其是在GPQA基准测试中的表现。一个2.6B参数的模型能够取得如此高的分数,甚至超越规模更大的模型(如DeepSeek R1-0528),这一事实值得关注。这表明模型架构和训练方法,特别是纯强化学习的使用,非常有效。在指令遵循、知识和数学基准测试方面的一致改进进一步巩固了其潜力。这一发展可能预示着向更高效、更紧凑的模型转变,这些模型可以与更大模型的性能相媲美,从而可能降低计算成本和可访问性障碍。
引用
“LFM2-2.6B-Exp是使用纯强化学习在LFM2-2.6B上构建的实验性检查点。”