Research#llm🏛️ Official分析: 2025年12月28日 21:57

合成自举预训练

发布:2025年12月16日 00:00
1分で読める
Apple ML

分析

本文介绍了合成自举预训练 (SBP),这是一种由 Apple ML 开发的新型语言模型预训练方法。 SBP 旨在通过对文档间相关性进行建模来提高语言模型的性能,而标准预训练方法通常会忽略这种相关性。其核心思想是首先学习文档之间关系的模型,然后使用它来生成更大的合成语料库以进行联合训练。这种方法旨在捕捉数据中更丰富、更复杂的关系,从而可能产生更有效的语言模型。本文强调了 SBP 通过利用文档间关系来提高模型性能的潜力。

引用

虽然标准预训练教导语言模型学习单个文档中标记之间的因果关系,但它并未被设计为有效地模拟可能导致更好性能的丰富、可学习的文档间相关性。