フェーズ勾配フローによるSSMのメモリ壁の突破
分析
本論文は、Selective State Space Models (SSM) のバックプロパゲーションにおける重要なメモリボトルネックに対処し、大規模なゲノムデータやその他の長いシーケンスデータへの応用を制限している。提案されたPhase Gradient Flow (PGF) フレームワークは、中間計算グラフを保存する必要をなくし、状態空間多様体で直接正確な解析的導関数を計算することにより、解決策を提供する。これにより、大幅なメモリ節約(O(1)のメモリ複雑度)とスループットの向上が実現し、以前は実現不可能だった非常に長いシーケンスの分析が可能になる。スティッフODE体制下でもPGFの安定性は重要な利点である。
重要ポイント
参照
“PGFは、シーケンス長に対してO(1)のメモリ複雑度を実現し、標準的なAutogradと比較して、ピークVRAMを94%削減し、スループットを23倍向上させる。”