LLMの一般化：推論の細粒度分析

Research Paper #Large Language Models (LLMs), Generalization, Reasoning, Fine-tuning 🔬 Research|分析: 2026年1月3日 16:50•

公開: 2025年12月30日 08:16

•

1分で読める

分析

本論文は、異なるファインチューニング手法（SFT vs. RL）がLLMの一般化行動に異なる結果をもたらす理由という重要な問題に取り組んでいます。単純な精度指標を超え、推論をコアな認知スキルに分解する新しいベンチマークを導入しています。これにより、これらのスキルがトレーニング中にどのように出現し、転移し、劣化するかをより詳細に理解できます。低レベルの統計パターンに焦点を当てることで分析がさらに強化され、LLMの一般化の背後にあるメカニズムに関する貴重な洞察が得られ、より効果的なトレーニング戦略を設計するためのガイダンスが提供されます。

重要ポイント

引用・出典

原文を見る

"RL-tuned models maintain more stable behavioral profiles and resist collapse in reasoning skills, whereas SFT models exhibit sharper drift and overfit to surface patterns."

ArXiv2025年12月30日 08:16

* 著作権法第32条に基づく適法な引用です。

古い記事

Show HN: Autotab – Programmable AI browser for turning web tasks into APIs

新しい記事

Launch HN: Mosaic (YC W25) – Agentic Video Editing

LLMの一般化：推論の細粒度分析

分析

重要ポイント

関連分析

SpaceTimePilot：空間と時間の制御による生成ビデオレンダリング

量子カオスハミルトニアン進化におけるランダム性生成

GaMO：幾何学認識拡散を用いた疎視点3D再構成

📬 AIニュースを受信

カテゴリで探す

トレンドトピック

📬 AIニュースを受信

カテゴリで探す

トレンドトピック