大型语言模型的时间预算推理

Paper#LLM🔬 Research|分析: 2026年1月3日 23:58
发布: 2025年12月26日 04:49
1分で読める
ArXiv

分析

本文解决了在时间敏感型应用中部署大型语言模型(LLM)的关键挑战。核心问题是LLM执行时间不可预测,这阻碍了它们在实时系统中的使用。TimeBill通过预测执行时间并自适应地调整推理过程以满足时间预算,从而提供了解决方案。这很重要,因为它使得LLM能够在对时间有要求的应用(如机器人技术和自动驾驶)中使用,而不会牺牲性能。
引用 / 来源
查看原文
"TimeBill proposes a fine-grained response length predictor (RLP) and an execution time estimator (ETE) to accurately predict the end-to-end execution time of LLMs."
A
ArXiv2025年12月26日 04:49
* 根据版权法第32条进行合法引用。