Yggdrasil:基于树结构的推测解码优化LLMPaper#llm🔬 Research|分析: 2026年1月3日 16:57•发布: 2025年12月29日 20:51•1分で読める•ArXiv分析本文解决了LLM推理中由于动态推测解码和静态运行时假设之间的不匹配而导致的性能瓶颈。 Yggdrasil 提出了一个协同设计的系统来弥合这一差距,旨在实现延迟最优的解码。 核心贡献在于其上下文感知的树草稿、编译器友好的执行和基于阶段的调度,从而实现了比现有方法显着的加速。 专注于实际改进和报告的加速是值得注意的。要点•提出了Yggdrasil,一个用于延迟最优推测解码的协同设计系统。•引入了用于静态图兼容性的等增长树结构。•采用延迟感知的优化目标进行草稿选择。•利用基于阶段的调度来减少开销。•实现了比现有基线显着的加速。引用 / 来源查看原文"Yggdrasil achieves up to $3.98\times$ speedup over state-of-the-art baselines."AArXiv2025年12月29日 20:51* 根据版权法第32条进行合法引用。较旧ChatGPT is not all you need. A SOTA Review of large Generative AI models较新ChatBCG: Generative AI For Slides相关分析Paper基于选择策略的协调人形机器人操作2026年1月3日 06:10Paper从未对齐图像即时进行3D场景编辑2026年1月3日 06:10Paper用于未来预测的LLM预测2026年1月3日 06:10来源: ArXiv