InstructMoLE:指令引导的专家混合用于图像生成
分析
本文解决了使用扩散Transformer进行多条件图像生成的挑战,特别关注参数高效的微调。它指出了现有方法(如LoRA和token级别的MoLE路由)的局限性,这些方法可能导致伪影。核心贡献是InstructMoLE,一个使用指令引导路由选择专家的框架,保留全局语义并提高图像质量。正交性损失的引入进一步增强了性能。本文的重要性在于它有可能改善指令驱动的图像生成中的组合控制和保真度。
要点
引用 / 来源
查看原文"InstructMoLE utilizes a global routing signal, Instruction-Guided Routing (IGR), derived from the user's comprehensive instruction. This ensures that a single, coherently chosen expert council is applied uniformly across all input tokens, preserving the global semantics and structural integrity of the generation process."