Yggdrasil:基于树结构的推测解码优化LLM

Paper#llm🔬 Research|分析: 2026年1月3日 16:57
发布: 2025年12月29日 20:51
1分で読める
ArXiv

分析

本文解决了LLM推理中由于动态推测解码和静态运行时假设之间的不匹配而导致的性能瓶颈。 Yggdrasil 提出了一个协同设计的系统来弥合这一差距,旨在实现延迟最优的解码。 核心贡献在于其上下文感知的树草稿、编译器友好的执行和基于阶段的调度,从而实现了比现有方法显着的加速。 专注于实际改进和报告的加速是值得注意的。
引用 / 来源
查看原文
"Yggdrasil achieves up to $3.98\times$ speedup over state-of-the-art baselines."
A
ArXiv2025年12月29日 20:51
* 根据版权法第32条进行合法引用。