Splitwise: 基于 Lyapunov 辅助 DRL 的自适应边缘-云 LLM 推理

Paper #llm 🔬 Research|分析: 2026年1月3日 16:08•

发布: 2025年12月29日 08:57

•

1分で読める

分析

本文解决了在边缘设备上部署大型语言模型 (LLM) 的挑战，平衡了延迟、能耗和准确性。它提出了 Splitwise，一个使用 Lyapunov 辅助深度强化学习 (DRL) 的新框架，用于在边缘和云资源之间动态划分 LLM。该方法意义重大，因为它提供了比静态分区方法更精细和自适应的解决方案，尤其是在带宽波动的环境中。 Lyapunov 优化的使用确保了队列的稳定性，并且具有鲁棒性，这对于实际部署至关重要。实验结果表明，延迟和能源效率有了显着提高。

要点

引用 / 来源

查看原文

"Splitwise reduces end-to-end latency by 1.4x-2.8x and cuts energy consumption by up to 41% compared with existing partitioners."

ArXiv2025年12月29日 08:57

* 根据版权法第32条进行合法引用。

较旧

Why is OpenAI buying Windsurf?

较新

Show HN: Open AI is not Open – A browser extension

Splitwise: 基于 Lyapunov 辅助 DRL 的自适应边缘-云 LLM 推理

分析

要点

相关分析

基于选择策略的协调人形机器人操作

从未对齐图像即时进行3D场景编辑

用于未来预测的LLM预测

📬 获取AI新闻

按类别浏览

热门话题

📬 获取AI新闻

按类别浏览

热门话题