s1の内側:Niklas Muennighoff氏と、50ドル以下で訓練されたo1スタイルの推論モデル - #721

Research#llm📝 Blog|分析: 2025年12月29日 06:07
公開: 2025年3月3日 23:56
1分で読める
Practical AI

分析

この記事は、Practical AIからのもので、Niklas Muennighoff氏の研究であるS1モデルについて議論しています。S1は、OpenAIのO1に触発された推論モデルです。焦点は、並列および逐次的な方法を含む、S1のテスト時スケーリングへの革新的なアプローチと、50ドル未満の訓練コストという費用対効果にあります。この記事では、モデルのデータキュレーション、トレーニングレシピ、Google GeminiとDeepSeek R1からの蒸留の使用を強調しています。また、「予算強制」技術、評価ベンチマーク、教師ありファインチューニングと強化学習の比較についても探求しています。S1のオープンソース化とその将来の方向性についても議論されています。
引用・出典
原文を見る
"We explore the motivations behind S1, as well as how it compares to OpenAI's O1 and DeepSeek's R1 models."
P
Practical AI2025年3月3日 23:56
* 著作権法第32条に基づく適法な引用です。