用于群体智能的贝叶斯Transformer

Research Paper#Large Language Models, Bayesian Methods, Transformers, Reinforcement Learning🔬 Research|分析: 2026年1月3日 06:11
发布: 2025年12月31日 18:56
1分で読める
ArXiv

分析

本文介绍了一种新方法,通过将大型语言模型(LLM)转化为贝叶斯Transformer来增强LLM。核心思想是从一组预先训练好的权重中采样,创建模型实例的“群体”,每个实例的行为略有不同。这允许多样且一致的预测,利用“群体智慧”来提高各种任务的性能,包括零样本生成和强化学习。
引用 / 来源
查看原文
"B-Trans effectively leverage the wisdom of crowds, yielding superior semantic diversity while achieving better task performance compared to deterministic baselines."
A
ArXiv2025年12月31日 18:56
* 根据版权法第32条进行合法引用。