GLUE:无梯度专家统一

Research Paper#Machine Learning, Model Fusion, Optimization🔬 Research|分析: 2026年1月3日 16:28
发布: 2025年12月27日 04:59
1分で読める
ArXiv

分析

本文解决了为新目标域组合多个预训练专家模型的挑战。它提出了一种新方法 GLUE,该方法通过使用无梯度优化技术 (SPSA) 来学习专家模型的混合系数,从而避免了完全反向传播的计算成本。这很重要,因为它允许在不需要大量训练的情况下有效地适应新领域。结果表明,与基线方法相比,准确性有所提高,突出了该方法的实用价值。
引用 / 来源
查看原文
"GLUE improves test accuracy by up to 8.5% over data-size weighting and by up to 9.1% over proxy-metric selection."
A
ArXiv2025年12月27日 04:59
* 根据版权法第32条进行合法引用。