マルチモーダルLLM推論におけるエネルギー分析と最適化

公開:2025年12月27日 19:49
1分で読める
ArXiv

分析

この論文は、テキストのみのLLM研究に比べて見過ごされがちな、マルチモーダル大規模言語モデル(MLLM)推論におけるエネルギー非効率性の重要な問題に取り組んでいます。詳細なステージレベルのエネルギー消費分析を提供し、「モダリティインフレーション」を非効率性の主要な原因として特定しています。この研究の価値は、電力トレースを使用し、複数のMLLMを評価してエネルギーオーバーヘッドを定量化し、アーキテクチャのボトルネックを特定する実証的なアプローチにあります。この論文の貢献は、よりエネルギー効率の高いMLLMサービングシステムを設計するための実用的な洞察と具体的な最適化戦略(DVFS)を提供しているため重要です。これは、これらのモデルの広範な採用にとって不可欠です。

参照

この論文は、同一の入力に対して、異なるMLLM間で17%から94%の範囲のエネルギーオーバーヘッドを定量化し、エネルギー消費のばらつきを強調しています。