VibeVoiceFusion 可以一键生成多人说话语音合成的 Web 应用 ylc3000 2025-11-07 0 浏览 0 点赞 resource 制作有声书或播客,需要为不同角色配不同的声音,找朋友又怕麻烦人家,自己配又很难演出多个角色的感觉。 无独有偶,在 GitHub 上找到了 VibeVoiceFusion 这个开源工具,可以一键生成多人说话语音合成的 Web 应用。 基于微软 VibeVoice 模型,提供了直观的可视化界面来管理说话人、编辑对话和生成语音。 GitHub:github.com/zhao-kun/VibeVoiceFusion 除此之外,还支持上传参考音频,一键克隆声音,保留不同说话人的独特音色,支持中/英工作流。 同时针对显存做了深度优化,最低 6GB 显存就,大部分人的电脑都能运行使用。 提供了 Docker 一键部署方式,也可以在本地手动安装,简单配置一下即可使用,还有详细的使用指南。 网闻录 VibeVoiceFusion 可以一键生成多人说话语音合成的 Web 应用