Research#llm📝 Blog分析: 2025年12月27日 11:03

初のLoRA(Z-image) - スクラッチからのデータセット (Qwen2511)

公開:2025年12月27日 06:40
1分で読める
r/StableDiffusion

分析

この投稿は、Qwen-Image-Edit 2511モデルを使用してLoRA(Low-Rank Adaptation)モデルを作成する個人の最初の試みを詳述しています。著者は、控えめなキャプションが付いた20枚の画像で構成されるデータセットをゼロから生成し、LoRAを3000ステップでトレーニングしました。結果は、3090Ti GPUで約3時間で完了した最初の試みとしては驚くほど肯定的でした。著者は、さまざまなLoRA強度でのプロンプトの遵守と画質の間にはトレードオフがあり、より高い強度では特徴的な「Qwen-ness」が観察されると述べています。彼らはプロセスを改良することに楽観的であり、「De-distill」モデルとBaseモデルの結果を比較することを楽しみにしています。この投稿は、カスタムLoRAを作成するためのQwenのようなオープンソースモデルのアクセシビリティと可能性を強調しています。

参照

最初の試みとしては、実際には驚いています。