自评估解锁任意步数文本到图像生成

发布:2025年12月26日 20:42
1分で読める
ArXiv

分析

这篇论文介绍了一种新颖的方法,Self-E,用于文本到图像生成,它允许使用较少的推理步骤生成高质量的图像。关键创新是一种自评估机制,该机制允许模型从其自身生成的样本中学习,充当动态的自教师。这消除了对预训练教师模型或依赖局部监督的需求,弥合了传统扩散/流模型和基于蒸馏的方法之间的差距。能够用较少的步骤生成高质量的图像是一项重大进步,可以实现更快、更有效的图像生成。

引用

Self-E 是第一个从头开始构建的、任意步数的文本到图像模型,提供了一个用于高效和可扩展生成的统一框架。