DeliberationBench: 多LLM协商表现逊于基线,引发对复杂性的质疑

research#llm🔬 Research|分析: 2026年1月15日 07:04
发布: 2026年1月15日 05:00
1分で読める
ArXiv NLP

分析

这项研究对多智能体 LLM 系统中日益增加复杂性的普遍趋势提出了关键的质疑。 简单的基线方法获得的显著性能优势,加上协商协议更高的计算成本,凸显了在实际应用中对 LLM 架构进行严格评估和可能简化的必要性。
引用 / 来源
查看原文
"the best-single baseline achieves an 82.5% +- 3.3% win rate, dramatically outperforming the best deliberation protocol(13.8% +- 2.6%)"
A
ArXiv NLP2026年1月15日 05:00
* 根据版权法第32条进行合法引用。