Mercury 2:通过扩散式LLM革新文本生成product#llm📝 Blog|分析: 2026年2月26日 06:45•发布: 2026年2月26日 03:13•1分で読める•Zenn LLM分析Inception Labs 的 Mercury 2 预示着文本生成的范式转变。通过采用类似于图像生成的扩散模型,它实现了前所未有的吞吐量和低延迟,承诺更快、更高效的LLM操作。这种创新方法可能会重新定义我们如何与 AI 交互和使用。关键要点•Mercury 2使用类似于Stable Diffusion的扩散模型进行文本生成。•在英伟达Blackwell GPU上实现了每秒1,009个令牌的惊人吞吐量。•这种新方法带来了非常低的延迟,端到端处理仅需1.7秒。引用 / 来源查看原文"Mercury 2是世界上第一个商用级“扩散式LLM”推理模型。"ZZenn LLM* 根据版权法第32条进行合法引用。永久链接Zenn LLM
SGLang 为扩散LLM赋能:LLaDA 2.0 第 0 天支持!research#llm📝 Blog|分析: 2026年2月10日 07:00•发布: 2026年2月10日 04:13•1分で読める•Zenn LLM分析这对大语言模型 (LLM) 的发展来说是个令人兴奋的消息! SGLang 实施的扩散大语言模型 (dLLM) 框架实现了无缝集成,并利用了现有的优化技术。 这意味着更快的推理和更高的用户灵活性。关键要点•SGLang 现在支持扩散 LLM,提供了一种新的模型架构方法。•现有的 Chunked-Prefill 机制支持无缝集成和性能优势。•用户可以自由定制扩散解码算法。引用 / 来源查看原文"我们很高兴在 SGLang 中引入扩散大语言模型 (dLLM) 框架的设计和实现。"ZZenn LLM* 根据版权法第32条进行合法引用。永久链接Zenn LLM
ELYZA 发布专注于日语的颠覆性扩散 LLM!research#llm📝 Blog|分析: 2026年1月16日 07:30•发布: 2026年1月16日 01:30•1分で読める•Zenn LLM分析ELYZA 实验室正在通过其新的专注于日语的扩散语言模型掀起波澜!这些模型,ELYZA-Diffusion-Base-1.0-Dream-7B 和 ELYZA-Diffusion-Instruct-1.0-Dream-7B,承诺通过将图像生成 AI 技术应用于文本,打破传统限制,带来令人兴奋的进步。关键要点•ELYZA 正在发布两个新的扩散语言模型,专门针对日语语言性能。•这些模型利用扩散技术,反映了图像生成 AI 的进步。•这种方法旨在克服传统语言模型中存在的局限性。引用 / 来源查看原文"ELYZA Lab is introducing models that apply the techniques of image generation AI to text."ZZenn LLM* 根据版权法第32条进行合法引用。永久链接Zenn LLM
SGLang支持扩散LLM:LLaDA 2.0的Day-0实现research#llm📝 Blog|分析: 2026年1月6日 07:13•发布: 2026年1月5日 16:35•1分で読める•Zenn ML分析本文重点介绍了扩散LLM LLaDA 2.0快速集成到SGLang框架中。利用现有的分块预填充机制表明重点在于高效实现和利用现有基础设施。本文的价值在于展示了SGLang的适应性以及基于扩散的LLM更广泛采用的潜力。关键要点•SGLang现在支持Diffusion LLM。•LLaDA 2.0已在SGLang中实现。•集成利用现有的分块预填充机制。引用 / 来源查看原文"SGLangにDiffusion LLM(dLLM)フレームワークを実装"ZZenn ML* 根据版权法第32条进行合法引用。永久链接Zenn ML