SenseNova的 NEO-unify 放弃VAE,开启原生图像生成新纪元

research#image generation📝 Blog|分析: 2026年4月14日 02:40
发布: 2026年4月14日 02:01
1分で読める
r/StableDiffusion

分析

商汤科技的SenseNova推出了NEO-unify,这是一个具有突破性的20亿参数的统一模型,它直接在像素上生成图像,而无需依赖单独的VAE或编码器。该架构在图像重建上达到了惊人的31.56 PSNR,消除了传统扩散模型(如Stable Diffusion)中经常出现的令人沮丧的伪影。对于生成式人工智能社区来说,最激动人心的消息是,这个高效且具有原生理解能力的模型正在准备开源发布,这标志着创意工具向前迈出了一大步。
引用 / 来源
查看原文
"他们没有使用我们在Stable Diffusion或FLUX中习惯的通常的CLIP + VAE + Diffusion设置,而是构建了一个名为NEO-unify的原生统一模型。"
R
r/StableDiffusion2026年4月14日 02:01
* 根据版权法第32条进行合法引用。