用于群体智能的贝叶斯Transformer

发布:2025年12月31日 18:56
1分で読める
ArXiv

分析

本文介绍了一种新方法,通过将大型语言模型(LLM)转化为贝叶斯Transformer来增强LLM。核心思想是从一组预先训练好的权重中采样,创建模型实例的“群体”,每个实例的行为略有不同。这允许多样且一致的预测,利用“群体智慧”来提高各种任务的性能,包括零样本生成和强化学习。

引用

B-Trans有效地利用了群体智慧,在语义多样性方面表现出色,同时实现了比确定性基线更好的任务性能。