大型语言模型的时间预算推理

Paper #LLM 🔬 Research|分析: 2026年1月3日 23:58•

发布: 2025年12月26日 04:49

•

1分で読める

分析

本文解决了在时间敏感型应用中部署大型语言模型（LLM）的关键挑战。核心问题是LLM执行时间不可预测，这阻碍了它们在实时系统中的使用。TimeBill通过预测执行时间并自适应地调整推理过程以满足时间预算，从而提供了解决方案。这很重要，因为它使得LLM能够在对时间有要求的应用（如机器人技术和自动驾驶）中使用，而不会牺牲性能。

关键要点

引用 / 来源

查看原文

"TimeBill proposes a fine-grained response length predictor (RLP) and an execution time estimator (ETE) to accurately predict the end-to-end execution time of LLMs."

ArXiv2025年12月26日 04:49

* 根据版权法第32条进行合法引用。

较旧

Every ChatGPT 5 conversation in two pictures

较新

Professor Hideki Yukawa's Anguish and a Lifelong Decision During a Three-Day Visit to Kochi to Unveil His First Bronze Statue: From a Cave Bat to the World

大型语言模型的时间预算推理

分析

关键要点

相关分析

从未对齐图像即时进行3D场景编辑

基于选择策略的协调人形机器人操作

用于未来预测的LLM预测

📬 Get AI News Delivered

按类别浏览

热门话题

📬 Get AI News Delivered

按类别浏览

热门话题