用于群体智能的贝叶斯Transformer
Research Paper#Large Language Models, Bayesian Methods, Transformers, Reinforcement Learning🔬 Research|分析: 2026年1月3日 06:11•
发布: 2025年12月31日 18:56
•1分で読める
•ArXiv分析
本文介绍了一种新方法,通过将大型语言模型(LLM)转化为贝叶斯Transformer来增强LLM。核心思想是从一组预先训练好的权重中采样,创建模型实例的“群体”,每个实例的行为略有不同。这允许多样且一致的预测,利用“群体智慧”来提高各种任务的性能,包括零样本生成和强化学习。