用于LVLM的抗幻觉解码

Paper#llm🔬 Research|分析: 2026年1月3日 16:06
发布: 2025年12月29日 13:23
1分で読める
ArXiv

分析

这篇论文解决了大型视觉语言模型(LVLM)中的一个关键问题:幻觉。它提出了一种新颖的、无需训练的解码框架CoFi-Dec,该框架利用生成式自反馈和粗到细的视觉条件来缓解这个问题。该方法与模型无关,并在以幻觉为重点的基准测试中表现出显著的改进,使其成为该领域的一项有价值的贡献。使用基于Wasserstein的融合机制来对齐预测特别有趣。
引用 / 来源
查看原文
"CoFi-Dec substantially reduces both entity-level and semantic-level hallucinations, outperforming existing decoding strategies."
A
ArXiv2025年12月29日 13:23
* 根据版权法第32条进行合法引用。