初のLoRA(Z-image) - スクラッチからのデータセット (Qwen2511)

Research#llm📝 Blog|分析: 2025年12月27日 11:03
公開: 2025年12月27日 06:40
1分で読める
r/StableDiffusion

分析

この投稿は、Qwen-Image-Edit 2511モデルを使用してLoRA(Low-Rank Adaptation)モデルを作成する個人の最初の試みを詳述しています。著者は、控えめなキャプションが付いた20枚の画像で構成されるデータセットをゼロから生成し、LoRAを3000ステップでトレーニングしました。結果は、3090Ti GPUで約3時間で完了した最初の試みとしては驚くほど肯定的でした。著者は、さまざまなLoRA強度でのプロンプトの遵守と画質の間にはトレードオフがあり、より高い強度では特徴的な「Qwen-ness」が観察されると述べています。彼らはプロセスを改良することに楽観的であり、「De-distill」モデルとBaseモデルの結果を比較することを楽しみにしています。この投稿は、カスタムLoRAを作成するためのQwenのようなオープンソースモデルのアクセシビリティと可能性を強調しています。
引用・出典
原文を見る
"I'm actually surprised for a first attempt."
R
r/StableDiffusion2025年12月27日 06:40
* 著作権法第32条に基づく適法な引用です。