基于成语的视觉双关:迭代式LLM-T2I框架ArXiv•2025年11月28日 07:30•Research▸▾Research#LLM🔬 Research|分析: 2026年1月10日 14:02•发布: 2025年11月28日 07:30•1分で読める•ArXiv分析这项研究探索了大型语言模型(LLM)在生成成语视觉表征方面的新应用。 结合 LLM、文本到图像模型(T2I)和多模态大型语言模型(MLLM)的迭代框架是一种很有前景的方法。要点与引用▶▼•该框架利用 LLM 的能力来理解和解释成语。•它利用 T2I 模型将文本描述转化为视觉表征。•迭代方法基于反馈和 MLLM 分析来完善视觉输出。引用 / 来源查看原文"The research uses an iterative framework combining LLMs, T2I models, and MLLMs."AArXiv* 根据版权法第32条进行合法引用。永久链接ArXiv