分析
这篇文章庆祝了扩散模型的演变,追溯了它们从理论概念到现代人工智能图像生成基础的历程。它突出了克服了实际障碍的关键突破,使得 Midjourney 和 DALL-E 等工具成为可能,并引发了人工智能艺术革命。
关于ai image generation的新闻、研究和更新。由AI引擎自动整理。
"我要求Google Gemini制作一个黑皮肤的梦魇... AI拒绝完成任务。我迫使它提供理由,它回答说:“梦魇是邪恶的,所以制作黑皮肤可能被解释为种族主义”。"
"NanoBanana 2 的开发理念是“以 Gemini Flash 的速度实现 NanoBanana Pro 的高级功能”,它是一款尖端的图像生成/编辑模型。"
"这次它确实奏效了!我问了它对 facedetailer 等自定义节点的熟悉程度,它能够理解并将其与多 lora 加载器一起实现到工作流程中。"
"是否有可能展示任何有意义的结果,即使是一个非常小的结果,即训练多模态模型(脑电图 + 文本)来生成图像?"
"I went from an average of about 32 second for a 1024x1024 image down to 22 seconds using an rtx4060."
"I've added some labels to the images to show comparisons between model base and with LORA to make it clear what you're looking at."
"The model performs better when you directly reference objects in the image, making vllms better at prompting"
"With tools like ChatGPT and Gemini, creating such images is a snap!"
"I was able play with Flux Klein before release and it's a blast."