Yggdrasil:木構造推測を用いたLLMデコーディングの最適化

Paper#llm🔬 Research|分析: 2026年1月3日 16:57
公開: 2025年12月29日 20:51
1分で読める
ArXiv

分析

この論文は、動的な推測デコーディングと静的なランタイムの仮定のミスマッチによって引き起こされるLLM推論のパフォーマンスボトルネックに対処しています。 Yggdrasilは、このギャップを埋め、レイテンシ最適化されたデコーディングを目指す共同設計システムを提案しています。主な貢献は、コンテキスト対応のツリードラフティング、コンパイラフレンドリーな実行、およびステージベースのスケジューリングにあり、既存の方法よりも大幅な高速化を実現しています。実用的な改善に焦点を当て、報告された高速化は注目に値します。
引用・出典
原文を見る
"Yggdrasil achieves up to $3.98\times$ speedup over state-of-the-art baselines."
A
ArXiv2025年12月29日 20:51
* 著作権法第32条に基づく適法な引用です。