DeliberationBench: マルチLLMによる協議はベースラインを下回り、複雑さへの疑問を提起

research#llm🔬 Research|分析: 2026年1月15日 07:04
公開: 2026年1月15日 05:00
1分で読める
ArXiv NLP

分析

この研究は、マルチエージェントLLMシステムの複雑性を増す傾向に対する重要な対照を示しています。 単純なベースラインを支持する大きなパフォーマンスの差と、協議プロトコルの高い計算コストは、実践的なアプリケーションにおける厳格な評価とLLMアーキテクチャの潜在的な簡素化の必要性を強調しています。
引用・出典
原文を見る
"the best-single baseline achieves an 82.5% +- 3.3% win rate, dramatically outperforming the best deliberation protocol(13.8% +- 2.6%)"
A
ArXiv NLP2026年1月15日 05:00
* 著作権法第32条に基づく適法な引用です。