ユーモラスなミーム生成のためのVLMの強化

Paper#VLM, Meme Generation, Humor, Reinforcement Learning🔬 Research|分析: 2026年1月3日 09:21
公開: 2025年12月31日 01:35
1分で読める
ArXiv

分析

この論文は、ユーモラスなミームを生成するVision-Language Models (VLM)の能力を向上させるために設計されたフレームワーク、HUMORを紹介しています。単純な画像からキャプション生成を超えて、階層的な推論(Chain-of-Thought)を組み込み、報酬モデルと強化学習を通じて人間の好みに合わせるという課題に取り組んでいます。このアプローチは、マルチパスCoTとグループごとの好み学習において革新的であり、より多様で高品質なミーム生成を目指しています。
引用・出典
原文を見る
"HUMOR employs a hierarchical, multi-path Chain-of-Thought (CoT) to enhance reasoning diversity and a pairwise reward model for capturing subjective humor."
A
ArXiv2025年12月31日 01:35
* 著作権法第32条に基づく適法な引用です。