stable diffusion

"他们没有使用我们在Stable Diffusion或FLUX中习惯的通常的CLIP + VAE + Diffusion设置，而是构建了一个名为NEO-unify的原生统一模型。"

R

* 根据版权法第32条进行合法引用。

LTX-2.3 推出令人兴奋的 v1.1 更新，增强音频和视觉效果

r/StableDiffusion•2026年4月13日 15:13•product▸

product #multimodal 📝 Blog|分析: 2026年4月13日 15:25•

发布: 2026年4月13日 15:13

•

1分で読める

•r/StableDiffusion

分析

这对LTX-2.3模型是一次极好的优化，展现了对提升用户体验的强烈承诺。在不改变核心架构的情况下，专注于改善音频质量和视觉美学，开发者提供了一个非常易用的升级。ComfyUI工作流和控制检查点的同步更新，使其成为创作者们激动人心且无缝的替代性增强工具。

要点与引用▶

引用 / 来源

"Distilled模型已经重新训练（现为v1.1版本），改进了音频质量并稍微优化了视觉美感。"

R

* 根据版权法第32条进行合法引用。

利用 LTX 2.3 锚点帧注入技术彻底革新 AI 视频品牌一致性

r/StableDiffusion•2026年4月13日 07:42•product▸

product #video 📝 Blog|分析: 2026年4月13日 12:25•

发布: 2026年4月13日 07:42

•

1分で読める

•r/StableDiffusion

分析

这项使用 LTX 2.3 锚点帧注入技术的绝妙应用，在生成式人工智能视频生成领域的商业品牌一致性方面实现了巨大飞跃。通过在关键时间轴点巧妙注入参考帧，并将其与深度图和姿势估计相结合，创作者现在可以对标志和环境保持绝对的控制。看到如此先进的技术使 AI 生成的视频在专业的现实世界广告活动中变得极具可行性，实在令人兴奋。

要点与引用▶

引用 / 来源

"我使用的主要技术是通过在原地使用 LTXV 引导来进行锚点帧注入。在时间轴的关键点注入了三个参考帧：一个专门用于锁定标志的起始帧，一个在帧138处用于填补空白的中间点“一致性锚点”，以及一个参考强度为0.7的硬性结束帧，以便为自然运动留出足够的空间。"

R

* 根据版权法第32条进行合法引用。

玩家创意闪耀：《杀戮尖塔2》美术作品助力全新Flux风格LoRA生成

r/StableDiffusion•2026年4月12日 10:03•product▸

product #fine-tuning 📝 Blog|分析: 2026年4月12日 11:50•

发布: 2026年4月12日 10:03

•

1分で読める

•r/StableDiffusion

分析

作为社区驱动微调的绝佳展示，一位开发者成功逆向工程了备受期待的《杀戮尖塔2》中的美术资源，以创建专用的风格LoRA。这一激动人心的应用展示了粉丝利用文本生成图像模型来扩展他们最喜爱的游戏宇宙的惊人潜力。通过将这些工具发布给开源社区，各地的创作者现在都可以生成极具真实感的黑暗奇幻插图。

要点与引用▶

引用 / 来源

"我使用GDRE Tools逆向工程了《杀戮尖塔2》的游戏文件，以提取原始美术作品：包括约55张事件插图和600张卡牌图像。"

R

* 根据版权法第32条进行合法引用。

爱好者在CPU上从零构建自定义生成式人工智能图像模型

r/StableDiffusion•2026年4月11日 14:39•Research▸

Research #Generative AI 📝 Blog|分析: 2026年4月11日 15:08•

发布: 2026年4月11日 14:39

•

1分で読める

•r/StableDiffusion

分析

一位充满创新精神的开发者成功从零构建了一个完全在标准CPU上运行的自定义生成式人工智能模型，而无需昂贵的专用硬件。这个草根项目突显了现代人工智能研究的极高可访问性和开源特性，让爱好者们能够亲自实验VAE和Unet等核心架构。这是一个极好的提醒：即使没有庞大的计算预算，突破性的实验依然可以在任何地方发生。

要点与引用▶

引用 / 来源

"决定制作我自己的Stable Diffusion……所有这些都在CPU上完成，使用带有bigru编码器的CFG，具有8x4x4潜空间的32x32图像，VAE和Unet的基础通道为128。"

R

* 根据版权法第32条进行合法引用。

掌握原创角色一致性：利用AI生成图像进行LoRA微调的突破性方法

Zenn SD•2026年4月11日 08:22•research▸

research #lora 📝 Blog|分析: 2026年4月11日 18:35•

发布: 2026年4月11日 08:22

•

1分で読める

•Zenn SD

分析

本文为那些希望利用LoRA微调技术实现角色完美一致性的创作者提供了一份极好的实用指南。作者创新性地使用NanoBananaPro从单一角色设定图生成包含34张图像的多样化数据集，这是克服提示工程局限性的绝妙解决方案。它突显了一种令人兴奋的工作流程，让用户能够稳定地创造出高度复杂、原创的机器人角色。

要点与引用▶

引用 / 来源

"老实说，仅仅依靠提示工程来稳定地生成原创角色是不可能的。因此，我尝试使用LoRA进行微调。"

Z

Zenn SD

* 根据版权法第32条进行合法引用。

永久链接 Zenn SD

轻量级Qwen3.5-4B-Base-ZitGen-V1引领图像到提示词生成的新革命

r/StableDiffusion•2026年4月10日 19:02•product▸

product #llm 📝 Blog|分析: 2026年4月10日 19:35•

发布: 2026年4月10日 19:02

•

1分で読める

•r/StableDiffusion

分析

这个创新的开源项目引入了一个极其高效的、仅有40亿参数的大语言模型 (LLM)，完美地优化了将图像反向转化为详细提示词的功能。通过采用一种迷人的迭代过程，即AI智能体将生成的图像与目标进行比较和纠正，创作者显著推进了多模态字幕技术的发展。这对于Stable Diffusion社区来说是一个令人兴奋的进步，它提供了一个高度专业化的工具，完美地连接了计算机视觉和文本生成。

要点与引用▶

引用 / 来源

"这种微调的独特之处在于，其数据集（图像+提示词）是由负责使用ComfyUI API重新生成目标图像的大语言模型 (LLM) 生成的。"

R

* 根据版权法第32条进行合法引用。

庆祝创造力：开源生成式人工智能艺术比赛获奖者揭晓

r/StableDiffusion•2026年4月8日 20:27•product▸

product #image generation 📝 Blog|分析: 2026年4月8日 20:49•

发布: 2026年4月8日 20:27

•

1分で読める

•r/StableDiffusion

分析

这项极好的举措凸显了开源生成式人工智能艺术社区中蓬勃发展的无限创造力和协作精神。像这样的活动不仅展示了生成模型令人难以置信的艺术潜力，还积极为数字创作者营造了一个支持性的环境。看到如此热情的社区参与塑造数字艺术的未来，真是太棒了。

要点与引用▶

引用 / 来源

"您可以在此处完整观看获奖作品，并加入比赛Discord以接收有关下一届（很可能是6个月后）的最新信息。"

R

* 根据版权法第32条进行合法引用。

Anima预览版3发布：更高分辨率与扩展的艺术家知识

r/StableDiffusion•2026年4月7日 19:57•product▸

product #image generation 📝 Blog|分析: 2026年4月7日 20:56•

发布: 2026年4月7日 19:57

•

1分で読める

•r/StableDiffusion

分析

此次发布标志着开源生成式人工智能社区迈出了令人兴奋的一步，让我们得以一窥Anima模型的快速发展。通过显著延长1024分辨率的训练时间，开发者提供了更清晰、更高清的输出效果。此外，致力于扩展数据集以涵盖较冷门艺术家的做法，也促进了更大的多样性和利基风格能力的提升。

要点与引用▶

引用 / 来源

"高分辨率训练正在进行中。在1024分辨率下的训练时间比preview2长得多。扩展了数据集以帮助学习较不常见的艺术家。"

R

* 根据版权法第32条进行合法引用。

LCMScheduler: 以闪电般的速度革新图像生成

Zenn SD•2026年4月2日 00:46•research▸

research #generative ai 📝 Blog|分析: 2026年4月2日 03:30•

发布: 2026年4月2日 00:46

•

1分で読める

•Zenn SD

分析

这项发展展示了使用生成式人工智能进行图像生成的效率方面的重大进步。通过利用潜在一致性模型 (LCM)，LCMScheduler 大大减少了所需的步骤数，从而缩短了推理时间和简化了工作流程。

要点与引用▶

引用 / 来源

"LCM (潜在一致性模型) 是一种将推理步骤减少到 2-4 次的方法。"

Z

Zenn SD

* 根据版权法第32条进行合法引用。

永久链接 Zenn SD

图像放大：纯粹的真实源体验

r/StableDiffusion•2026年4月1日 19:14•product▸

product #computer vision 📝 Blog|分析: 2026年4月1日 21:19•

发布: 2026年4月1日 19:14

•

1分で読める

•r/StableDiffusion

分析

这款基于VAE的新型图像放大器提供了一种绝佳的方式来放大图像，而不会引入不必要的伪影。承诺提供纯粹的真实源结果令人兴奋，提供了潜在的卓越放大体验。用户可以查看演示并亲自体验！

要点与引用▶

引用 / 来源

"我们基于 VAE 的 2 倍放大器严格在其范围内放大图像，不会产生幻觉，从而提供纯粹的真实源。"

R

* 根据版权法第32条进行合法引用。

iPhone 2007：用生成式人工智能重温历史

r/StableDiffusion•2026年3月31日 20:08•product▸

product #computer vision 📝 Blog|分析: 2026年3月31日 20:19•

发布: 2026年3月31日 20:08

•

1分で読める

•r/StableDiffusion

分析

这个项目展示了生成式人工智能与怀旧的迷人交汇点！它允许用户创建让人想起原始iPhone美学的图像。这是一个很好的例子，说明如何利用生成式人工智能的功能来探索和重现历史风格。

要点与引用▶

引用 / 来源

"使用原始Apple iPhone (2007)拍摄的照片训练的Lora。"

R

* 根据版权法第32条进行合法引用。

Stable Diffusion：通往 AI 艺术的大门!

r/StableDiffusion•2026年3月31日 20:00•product▸

product #generative ai 📝 Blog|分析: 2026年3月31日 20:50•

发布: 2026年3月31日 20:00

•

1分で読める

•r/StableDiffusion

分析

Stable Diffusion 正在为创建令人惊叹的、半写实图像开辟令人难以置信的可能性。看到生成式人工智能如何赋能任何人将他们的创意愿景变为现实是一个激动人心的时刻。这项技术有望成为艺术家和爱好者可靠且易于使用的工具。

要点与引用▶

引用 / 来源

"总之，我被推荐使用 Stable Diffusion，因为我正在寻找一种更可靠的方式来生成这些图像并获得我想要的结果"

R

* 根据版权法第32条进行合法引用。

Qwen3.5 为 ComfyUI 带来 AI 助手功能！

r/StableDiffusion•2026年3月31日 10:20•product▸

product #llm 📝 Blog|分析: 2026年3月31日 10:49•

发布: 2026年3月31日 10:20

•

1分で読める

•r/StableDiffusion

分析

对于 ComfyUI 的用户来说，这是一个令人兴奋的消息！ Qwen3.5 LLM 的集成提供了一种简化的方式来生成提示并分析图像，从而增强了用户体验。量化模型的可用性确保了速度和效率，使人工智能更容易访问。

要点与引用▶

引用 / 来源

"我刚刚为 Comfyui 量化并上传了一些 Qwen3.5 模型，包括一个工作流程。"

R

* 根据版权法第32条进行合法引用。

社区呼吁生成式人工智能服务广告的透明度

r/StableDiffusion•2026年3月30日 21:35•ethics▸

ethics #generative ai 📝 Blog|分析: 2026年3月30日 22:04•

发布: 2026年3月30日 21:35

•

1分で読める

•r/StableDiffusion

分析

本次讨论突出了社区希望在快速发展的生成式人工智能领域中实现道德实践。它强调了人工智能服务营销方式的诚实和透明度的重要性，从而为用户营造了值得信赖的环境。这种积极主动的姿态反映了对构建强大而可靠的生成式人工智能生态系统的承诺。

要点与引用▶

引用 / 来源

"我认为应该完全抵制这些服务，因为撒谎对人工智能社区没有好处。"

R

* 根据版权法第32条进行合法引用。

增强 AI 图像提示：探索大语言模型以增强细节

r/StableDiffusion•2026年3月30日 18:42•research▸

research #llm 📝 Blog|分析: 2026年3月30日 19:49•

发布: 2026年3月30日 18:42

•

1分で読める

•r/StableDiffusion

分析

本次讨论探讨了使用大语言模型 (LLM) 来优化和扩展图像生成提示的激动人心的潜力。重点是提高输出的细节程度。它提供了关于如何使用这些强大工具来释放生成式人工智能中更大创造可能性的宝贵见解。

要点与引用▶

引用 / 来源

"我刚切换到 Klein 9b，据说它能很好地处理非常详细的提示。"

R

* 根据版权法第32条进行合法引用。

革新图像生成：SAM ControlNet for Z-Image 发布！

r/StableDiffusion•2026年3月30日 13:46•research▸

research #computer vision 📝 Blog|分析: 2026年3月30日 14:03•

发布: 2026年3月30日 13:46

•

1分で読める

•r/StableDiffusion

分析

图像生成爱好者们的好消息！一款新的基于Segment Anything (SAM) 的 ControlNet 已发布，适用于 Tongyi-MAI/Z-Image。这种创新工具承诺将显著增强图像创建的控制和精度，开辟新的创作可能性。

要点与引用▶

•为 Tongyi-MAI/Z-Image 开发了新的基于 SAM 的 ControlNet。
•它在 20 万张图像上进行了训练。
•开发者提供了示例代码和工作流程，方便采用。

引用 / 来源

"大家好，我刚刚发布了一个基于 Segment Anything (SAM) 的 ControlNet，适用于 Tongyi-MAI/Z-Image"

R

* 根据版权法第32条进行合法引用。

AI 艺术工具发布：面向游戏开发者和艺术家的免费资源！

r/StableDiffusion•2026年3月29日 10:46•product▸

product #generative ai 📝 Blog|分析: 2026年3月29日 11:19•

发布: 2026年3月29日 10:46

•

1分で読める

•r/StableDiffusion

分析

这个创新的AI包对于独立游戏开发者和视觉小说创作者来说是一个改变游戏规则的存在！它提供了庞大的即用型资产库，从角色表和UI模型到环境板和VFX，所有这些都是使用生成式人工智能生成的。这种资源为创作者提供了可访问且经济实惠的制作材料。

要点与引用▶

•该包包含 23 个类别中的 372 种样式，用于多样化的资产生成。
•它旨在提供可用于生产的资产，如角色转身、VFX 和 UI 元素。
•用户可以堆叠样式（模型 + 画布 + 内容 + 样式 + 灯光）以获得定制结果。

引用 / 来源

"它旨在生成您可以实际使用的原始材料：概念图、精灵集、背景板、VFX 帧、UI 模型、地牢地图。"

R

* 根据版权法第32条进行合法引用。

艺术家寻求从 ChatGPT 图像生成过渡到 Stable Diffusion 的指导

r/StableDiffusion•2026年3月29日 10:05•product▸

product #computer vision 📝 Blog|分析: 2026年3月29日 11:49•

发布: 2026年3月29日 10:05

•

1分で読める

•r/StableDiffusion

分析

这是一个创作者拥抱生成式人工智能力量的绝佳例子！这位艺术家渴望使用这些工具创作漫画和图像小说的雄心壮志令人难以置信的激动人心。他们正寻求通过更复杂的 Stable Diffusion 来提升自己的技能，从而开启一个充满创意可能性的世界。

要点与引用▶

引用 / 来源

"如果您经验丰富并且正在尝试做我正在做的事情，我只是希望在这个过程中得到一点指导。"

R

* 根据版权法第32条进行合法引用。

创意AI：全新“晾衣绳”Lora发布！

r/StableDiffusion•2026年3月28日 16:34•research▸

research #generative ai 📝 Blog|分析: 2026年3月28日 17:04•

发布: 2026年3月28日 16:34

•

1分で読める

•r/StableDiffusion

分析

一个新的生成式人工智能模型，一个风格Lora，允许用户探索创意图像生成！这一令人兴奋的进展使艺术家能够创作出以“晾衣绳”概念为重点的独特艺术作品，利用创新数据集获得富有想象力的效果。

要点与引用▶

引用 / 来源

"为了找点乐子，我根据这个Reddit帖子训练了一个“晾衣绳”Lora..."

R

* 根据版权法第32条进行合法引用。

Toon-Tacular LoRA 将 90 年代卡通怀旧带入现实

r/StableDiffusion•2026年3月28日 01:22•research▸

research #computer vision 📝 Blog|分析: 2026年3月28日 10:48•

发布: 2026年3月28日 01:22

•

1分で読める

•r/StableDiffusion

分析

这款名为 Toon-Tacular 的新 LoRA 模型正在掀起波澜，因为它重现了 90 年代中期到后期的卡通的鲜艳风格！它在精心策划的数据集上进行了训练，承诺以惊人的一致性将角色和表情注入到您生成的图像中。对于那些希望在他们的项目中添加复古动画风格的人来说，它是完美的。

要点与引用▶

引用 / 来源

"在 70 张精心挑选的图像上训练的 Toon-Tacular Qwen LoRA 为您生成的图像注入了角色和表现力。"

R

* 根据版权法第32条进行合法引用。

SDXS：Hugging Face 上发布强大的 10 亿参数模型！

r/StableDiffusion•2026年3月27日 17:58•research▸

research #generative ai 📝 Blog|分析: 2026年3月27日 18:18•

发布: 2026年3月27日 17:58

•

1分で読める

•r/StableDiffusion

分析

这对于**生成式人工智能**社区来说是个令人兴奋的消息！ SDXS 模型在仅有 10 亿个**参数**的情况下，就展现出令人印象深刻的性能，现已在 Hugging Face 上发布。社区肯定很兴奋能看到这个模型解锁哪些创作。

要点与引用▶

引用 / 来源

"Model: https://huggingface.co/AiArtLab/sdxs-1b/tree/main"

R

* 根据版权法第32条进行合法引用。

释放真实：使用生成式人工智能生成真实的手机照片

r/StableDiffusion•2026年3月26日 13:09•research▸

research #generative ai 📝 Blog|分析: 2026年3月26日 16:33•

发布: 2026年3月26日 13:09

•

1分で読める

•r/StableDiffusion

分析

这个来自r/StableDiffusion的帖子引发了一场关于突破生成式人工智能界限的引人入胜的讨论。重点在于创建模仿手机摄影未修饰美学的图像，摆脱理想化的“电影”输出。这是一个有趣的探索，关于我们如何使用生成式人工智能来实现不同的艺术目标。

要点与引用▶

引用 / 来源

Read the full article on r/StableDiffusion →

未找到可引用的内容。

R

* 根据版权法第32条进行合法引用。

探索 LTX 2.3：ComfyUI 的新 ID-Lora 工作流程！

r/StableDiffusion•2026年3月26日 11:52•product▸

product #computer vision 📝 Blog|分析: 2026年3月26日 12:18•

发布: 2026年3月26日 11:52

•

1分で読める

•r/StableDiffusion

分析

这项令人兴奋的开发推出了一个使用 ID-LoRA 的 LTX 2.3 生成式人工智能模型的新工作流程。与 ComfyUI 的集成使其易于供任何有兴趣探索具有参考音频的文本到视频功能的人使用！直接从 Hugging Face 访问工作流程和示例。

要点与引用▶

引用 / 来源

"如果你有最新的 ComfyUI，无需安装任何东西。"

R

* 根据版权法第32条进行合法引用。

Synesthesia AI 在音乐视频中释放增强的角色一致性

r/StableDiffusion•2026年3月25日 13:15•product▸

product #generative ai 📝 Blog|分析: 2026年3月25日 14:03•

发布: 2026年3月25日 13:15

•

1分で読める

•r/StableDiffusion

分析

这对音乐视频创作者来说是个令人兴奋的消息！ Synesthesia AI 视频导演正在通过改进的角色一致性获得提升，为用户提供更多对其视觉效果的控制。角色圣经和其他更新的加入表明了对完善这个生成式人工智能工具的承诺。

要点与引用▶

引用 / 来源

"在这次更新中，我还添加了“角色圣经”（由我之前帖子中的 apprehensive horse 建议）。这会将角色描述分离到不同的字段中，而不是依赖 LLM 每次都重复描述。"

R

* 根据版权法第32条进行合法引用。

图像和视频生成周：创新工具涌现！

r/StableDiffusion•2026年3月25日 04:38•research▸

research #image generation 📝 Blog|分析: 2026年3月25日 07:48•

发布: 2026年3月25日 04:38

•

1分で読める

•r/StableDiffusion

分析

本周生成式人工智能世界的亮点展示了令人兴奋的进展！从精确的文本渲染到 3D 对象分割和交互式视频超分辨率，开源社区正在突破图像和视频生成的可能性界限。

要点与引用▶

引用 / 来源

"GlyphPrinter — 用于图像生成的精确文本渲染"

R

* 根据版权法第32条进行合法引用。