用于响应选择的LLM集成方法
分析
本文介绍了一种名为 LLM-PeerReview 的无监督集成方法,用于从多个大型语言模型 (LLM) 生成的候选中选择最佳响应。它利用了受同行评审启发的框架,使用 LLM 作为评委来评估和推理候选响应。该方法的主要优势在于其无监督的特性、可解释性以及强大的实验结果,在多个数据集上优于现有模型。
引用 / 来源
查看原文"LLM-PeerReview is conceptually simple and empirically powerful. The two variants of the proposed approach obtain strong results across four datasets, including outperforming the recent advanced model Smoothie-Global by 6.9% and 7.3% points, respectively."