合成ブートストラップ事前学習

Research#llm🏛️ Official|分析: 2025年12月28日 21:57
公開: 2025年12月16日 00:00
1分で読める
Apple ML

分析

この記事では、Apple MLが開発した新しい言語モデル事前学習手法である合成ブートストラップ事前学習(SBP)を紹介しています。 SBPは、標準的な事前学習アプローチでは見過ごされがちな、文書間の相関関係をモデル化することにより、言語モデルのパフォーマンスを向上させることを目指しています。その核心は、まず文書間の関係のモデルを学習し、次にそれを使用して、共同学習のためのより大きな合成コーパスを生成することです。このアプローチは、データ内のより豊かで複雑な関係を捉えるように設計されており、潜在的に、より効果的な言語モデルにつながる可能性があります。この記事は、SBPが文書間の関係を活用することにより、モデルのパフォーマンスを向上させる可能性を強調しています。
引用・出典
原文を見る
"While the standard pretraining teaches LMs to learn causal correlations among tokens within a single document, it is not designed to efficiently model the rich, learnable inter-document correlations that can potentially lead to better performance."
A
Apple ML2025年12月16日 00:00
* 著作権法第32条に基づく適法な引用です。