OTPrune：最適輸送によるトークン削減でマルチモーダルAIの推論に革命を

公開: 2026年2月25日 05:00

•

1分で読める

分析

OTPruneは、マルチモーダルモデルの推論を加速するための、トレーニング不要の新しい方法を導入しました。最適輸送を利用して、視覚的トークンを戦略的に削減し、効率性と表現忠実度の両方を向上させます。このアプローチは、最先端のAIのパフォーマンスと効率性のトレードオフの大幅な改善を約束します。

引用・出典

"完全なトークン分布と剪定されたトークン分布間の2-Wasserstein距離を最小化することにより、OTPruneは推論コストを削減しながら、ローカルな多様性とグローバルな代表性の両方を保持します。"

ArXiv Vision2026年2月25日 05:00

* 著作権法第32条に基づく適法な引用です。

Decoding LLMs: New Insights into Query Design and Reduced Hallucinations

Transformers Achieve Minimax Optimality in Nonparametric Regression: A Theoretical Breakthrough