ユーモラスなミーム生成のためのVLMの強化
Paper#VLM, Meme Generation, Humor, Reinforcement Learning🔬 Research|分析: 2026年1月3日 09:21•
公開: 2025年12月31日 01:35
•1分で読める
•ArXiv分析
この論文は、ユーモラスなミームを生成するVision-Language Models (VLM)の能力を向上させるために設計されたフレームワーク、HUMORを紹介しています。単純な画像からキャプション生成を超えて、階層的な推論(Chain-of-Thought)を組み込み、報酬モデルと強化学習を通じて人間の好みに合わせるという課題に取り組んでいます。このアプローチは、マルチパスCoTとグループごとの好み学習において革新的であり、より多様で高品質なミーム生成を目指しています。