Splitwise: Lyapunov最適化DRLを用いたエッジクラウドLLM推論

Paper #llm 🔬 Research|分析: 2026年1月3日 16:08•

公開: 2025年12月29日 08:57

•

1分で読める

分析

本論文は、大規模言語モデル（LLM）をエッジデバイスにデプロイする際の課題、すなわちレイテンシ、消費電力、精度をバランスさせる問題に取り組んでいます。Splitwiseという、Lyapunov最適化を用いた深層強化学習（DRL）による、エッジとクラウドのリソース間でのLLMの動的な分割を行う新しいフレームワークを提案しています。このアプローチは、静的な分割方法と比較して、よりきめ細かく適応的なソリューションを提供する点で重要であり、特に帯域幅が変動する環境において有効です。Lyapunov最適化の使用は、キューの安定性と堅牢性を保証し、これは実世界のデプロイメントにとって不可欠です。実験結果は、レイテンシとエネルギー効率の大幅な改善を示しています。

重要ポイント

引用・出典

原文を見る

"Splitwise reduces end-to-end latency by 1.4x-2.8x and cuts energy consumption by up to 41% compared with existing partitioners."

ArXiv2025年12月29日 08:57

* 著作権法第32条に基づく適法な引用です。

古い記事

Why is OpenAI buying Windsurf?

新しい記事

Show HN: Open AI is not Open – A browser extension

Splitwise: Lyapunov最適化DRLを用いたエッジクラウドLLM推論

分析

重要ポイント

関連分析

選択ポリシーを用いた協調型人型ロボット操作

未ポーズ画像からの即時3Dシーン編集

将来予測のためのLLMフォアキャスティング

📬 AIニュースを受信

カテゴリで探す

トレンドトピック

📬 AIニュースを受信

カテゴリで探す

トレンドトピック