OTPrune:最適輸送によるトークン削減でマルチモーダルAIの推論に革命を

research#computer vision🔬 Research|分析: 2026年2月25日 05:03
公開: 2026年2月25日 05:00
1分で読める
ArXiv Vision

分析

OTPruneは、マルチモーダルモデルの推論を加速するための、トレーニング不要の新しい方法を導入しました。 最適輸送を利用して、視覚的トークンを戦略的に削減し、効率性と表現忠実度の両方を向上させます。 このアプローチは、最先端のAIのパフォーマンスと効率性のトレードオフの大幅な改善を約束します。
引用・出典
原文を見る
"完全なトークン分布と剪定されたトークン分布間の2-Wasserstein距離を最小化することにより、OTPruneは推論コストを削減しながら、ローカルな多様性とグローバルな代表性の両方を保持します。"
A
ArXiv Vision2026年2月25日 05:00
* 著作権法第32条に基づく適法な引用です。