Research#llm📝 Blog分析: 2025年12月29日 06:07

s1の内側:Niklas Muennighoff氏と、50ドル以下で訓練されたo1スタイルの推論モデル - #721

公開:2025年3月3日 23:56
1分で読める
Practical AI

分析

この記事は、Practical AIからのもので、Niklas Muennighoff氏の研究であるS1モデルについて議論しています。S1は、OpenAIのO1に触発された推論モデルです。焦点は、並列および逐次的な方法を含む、S1のテスト時スケーリングへの革新的なアプローチと、50ドル未満の訓練コストという費用対効果にあります。この記事では、モデルのデータキュレーション、トレーニングレシピ、Google GeminiとDeepSeek R1からの蒸留の使用を強調しています。また、「予算強制」技術、評価ベンチマーク、教師ありファインチューニングと強化学習の比較についても探求しています。S1のオープンソース化とその将来の方向性についても議論されています。

参照

S1の背後にある動機を探求し、OpenAIのO1およびDeepSeekのR1モデルとの比較を行います。