mHC:多様体制約によるハイパー接続の安定化とスケーリング

Paper#Neural Network Architecture🔬 Research|分析: 2026年1月3日 06:23
公開: 2025年12月31日 14:16
1分で読める
ArXiv

分析

この論文は、ニューラルネットワークアーキテクチャにおける最近の進歩であるHyper-Connections (HC) の不安定性とスケーラビリティの問題に対処しています。HCは性能を向上させる一方で、残差接続の恒等写像特性を失い、トレーニングの困難さにつながります。mHCは、HC空間を多様体に射影することにより、恒等写像を復元し、効率を向上させる解決策を提案しています。これは、HCベースのモデルを改善し、スケーリングするための実用的な方法を提供し、将来の基礎モデルの設計に影響を与える可能性があるため重要です。
引用・出典
原文を見る
"mHC restores the identity mapping property while incorporating rigorous infrastructure optimization to ensure efficiency."
A
ArXiv2025年12月31日 14:16
* 著作権法第32条に基づく適法な引用です。