SenseNova的 NEO-unify 放弃VAE,开启原生图像生成新纪元
分析
商汤科技的SenseNova推出了NEO-unify,这是一个具有突破性的20亿参数的统一模型,它直接在像素上生成图像,而无需依赖单独的VAE或编码器。该架构在图像重建上达到了惊人的31.56 PSNR,消除了传统扩散模型(如Stable Diffusion)中经常出现的令人沮丧的伪影。对于生成式人工智能社区来说,最激动人心的消息是,这个高效且具有原生理解能力的模型正在准备开源发布,这标志着创意工具向前迈出了一大步。
关键要点
引用 / 来源
查看原文"他们没有使用我们在Stable Diffusion或FLUX中习惯的通常的CLIP + VAE + Diffusion设置,而是构建了一个名为NEO-unify的原生统一模型。"