M$^3$KG-RAG:マルチホップマルチモーダル知識グラフ強化検索拡張生成

Research#llm🔬 Research|分析: 2025年12月25日 02:34
公開: 2025年12月24日 05:00
1分で読める
ArXiv NLP

分析

本論文では、マルチモーダル大規模言語モデル(MLLM)の推論およびグラウンディング能力を強化するために、マルチホップマルチモーダル知識グラフ(MMKG)を活用した、新しい検索拡張生成(RAG)アプローチであるM$^3$KG-RAGを紹介しています。主な革新には、マルチホップMMKGを構築するためのマルチエージェントパイプラインと、正確なエンティティグラウンディングと冗長なコンテキストプルーニングのためのGRASP(Grounded Retrieval And Selective Pruning)メカニズムが含まれます。この論文は、既存のマルチモーダルRAGシステムの限界、特にモダリティカバレッジ、マルチホップ接続、および無関係な知識のフィルタリングに対処しています。実験結果は、さまざまなマルチモーダルベンチマークにおけるMLLMのパフォーマンスの大幅な改善を示しており、提案されたアプローチがマルチモーダル推論とグラウンディングの強化に効果的であることを示唆しています。
引用・出典
原文を見る
"To address these limitations, we propose M$^3$KG-RAG, a Multi-hop Multimodal Knowledge Graph-enhanced RAG that retrieves query-aligned audio-visual knowledge from MMKGs, improving reasoning depth and answer faithfulness in MLLMs."
A
ArXiv NLP2025年12月24日 05:00
* 著作権法第32条に基づく適法な引用です。