Research Paper#Multi-modal Sentiment Analysis, Mixture-of-Experts, Temporal Alignment, MLLM🔬 Research分析: 2026年1月3日 19:39
用于多模态情感分析的文本路由MoE模型
分析
本文介绍了TEXT,一种用于多模态情感分析(MSA)的新型模型,该模型利用多模态大型语言模型(MLLM)的解释,并结合了时间对齐。主要贡献包括使用解释、时间对齐块(结合Mamba和时间交叉注意力),以及带有门融合的文本路由稀疏混合专家。本文声称在多个数据集上实现了最先进的性能,证明了所提出方法的有效性。
引用
“TEXT在所有测试模型中,包括三个最近提出的方法和三个MLLM,在四个数据集上实现了最佳性能。”