動的サブスペース合成:効率的な適応のための収縮基底拡張

公開:2025年12月29日 13:11
1分で読める
ArXiv

分析

この論文は、モデルの容量をスケールする上で重要な、Mixture of Experts (MoE) モデルにおける表現の崩壊と勾配の不安定性の課題に対処しています。提案されたDynamic Subspace Composition (DSC) フレームワークは、Mixture-of-LoRAsのような標準的な方法と比較して、モデルの重みを適応させるためのより効率的で安定したアプローチを提供します。共有基底バンクとスパース展開の使用は、パラメータの複雑さとメモリトラフィックを削減し、潜在的にスケーラブルにします。正則化とスペクトル制約による理論的保証(最悪の場合の境界)への論文の焦点も、強力なポイントです。

参照

DSCは、重みの更新をStar-Shaped Domain内の残差軌道としてモデル化し、恒等性における連続性を保証するためにMagnitude-Gated Simplex Interpolationを採用しています。