Liquid AIのLFM2-2.6B-ExpモデルがGPQAで42%を達成、より大型モデルを凌駕

Research#llm📝 Blog|分析: 2025年12月25日 23:36
公開: 2025年12月25日 18:36
1分で読める
r/LocalLLaMA

分析

この発表は、Liquid AIのLFM2-2.6B-Expモデルの印象的な能力、特にGPQAベンチマークでの性能を強調しています。2.6Bパラメータのモデルがこれほど高いスコアを達成し、さらにサイズが大幅に大きいモデル(DeepSeek R1-0528など)を凌駕できるという事実は注目に値します。これは、モデルアーキテクチャとトレーニング方法論、特に純粋な強化学習の使用が非常に効果的であることを示唆しています。指示追従、知識、および数学ベンチマーク全体での一貫した改善は、その可能性をさらに強固にします。この開発は、より効率的でコンパクトなモデルへの移行を示唆しており、より大型のモデルのパフォーマンスに匹敵し、計算コストとアクセシビリティの障壁を潜在的に削減する可能性があります。
引用・出典
原文を見る
"LFM2-2.6B-Exp is an experimental checkpoint built on LFM2-2.6B using pure reinforcement learning."
R
r/LocalLLaMA2025年12月25日 18:36
* 著作権法第32条に基づく適法な引用です。