RadAR:基于径向自回归的高效视觉生成
Research Paper#Computer Vision, Generative Models, Autoregressive Models🔬 Research|分析: 2026年1月3日 08:51•
发布: 2025年12月31日 05:24
•1分で読める
•ArXiv分析
本文针对自回归模型在视觉生成中的低效性,提出了RadAR,一个利用图像空间关系实现并行生成的框架。核心思想是使用径向拓扑结构重新排序生成过程,从而实现同心环内token的并行预测。嵌套注意力机制的引入通过纠正并行生成过程中潜在的不一致性,进一步增强了模型的鲁棒性。这种方法为提高视觉生成速度,同时保持自回归模型的表征能力,提供了一个有前景的解决方案。