Splitwise: Lyapunov最適化DRLを用いたエッジクラウドLLM推論

Paper#llm🔬 Research|分析: 2026年1月3日 16:08
公開: 2025年12月29日 08:57
1分で読める
ArXiv

分析

本論文は、大規模言語モデル(LLM)をエッジデバイスにデプロイする際の課題、すなわちレイテンシ、消費電力、精度をバランスさせる問題に取り組んでいます。Splitwiseという、Lyapunov最適化を用いた深層強化学習(DRL)による、エッジとクラウドのリソース間でのLLMの動的な分割を行う新しいフレームワークを提案しています。このアプローチは、静的な分割方法と比較して、よりきめ細かく適応的なソリューションを提供する点で重要であり、特に帯域幅が変動する環境において有効です。Lyapunov最適化の使用は、キューの安定性と堅牢性を保証し、これは実世界のデプロイメントにとって不可欠です。実験結果は、レイテンシとエネルギー効率の大幅な改善を示しています。
引用・出典
原文を見る
"Splitwise reduces end-to-end latency by 1.4x-2.8x and cuts energy consumption by up to 41% compared with existing partitioners."
A
ArXiv2025年12月29日 08:57
* 著作権法第32条に基づく適法な引用です。