Voice Clone Studio 迎来重大升级:增强音频功能!product#voice📝 Blog|分析: 2026年2月11日 07:02•发布: 2026年2月11日 06:03•1分で読める•r/StableDiffusion分析Voice Clone Studio 已经完全重写,使其更加模块化和用户友好。 LuxTTS、MMaudio 和数据集创建工具等功能的加入,将这个项目提升为全面的音频解决方案,使其成为音频爱好者和创作者的强大工具。关键要点•支持多种 TTS 工具,包括 Qwen3-TTS、VibeVoice-TTS 和 LuxTTS。•包含 Windows、Linux 和 Mac 的安装脚本,方便设置。•具有自动音频分割功能,可有效创建数据集和训练模型。引用 / 来源查看原文"我添加了新的外观,以及许多新功能。"Rr/StableDiffusion* 根据版权法第32条进行合法引用。永久链接r/StableDiffusion
MMEDIT: 基于音频语言模型的统一多类型音频编辑框架Research#Audio Editing🔬 Research|分析: 2026年1月10日 08:06•发布: 2025年12月23日 13:14•1分で読める•ArXiv分析该论文介绍了MMEDIT,一个利用音频语言模型进行多功能音频编辑任务的新型框架。 这项研究通过提供一种统一的方法,有可能简化复杂的编辑工作流程,从而推动音频处理的发展。关键要点•MMEDIT提出了一个统一的多类型音频编辑框架。•它利用音频语言模型作为其核心功能。•这项研究来自ArXiv预印本服务器。引用 / 来源查看原文"The source of this research is ArXiv."AArXiv* 根据版权法第32条进行合法引用。永久链接ArXiv