Voicebox 是一款本地优先的开源语音克隆与语音合成工作室,为云端服务提供了私密的替代方案。它支持五种不同的 TTS 引擎、23 种语言以及高级后期处理效果,以创建高质量的音频内容。用户可以通过多轨时间轴编辑器管理复杂项目,并利用 REST API 将语音功能集成到自己的应用程序中。
Willow Inference Server 允许用户为各种应用程序自托管语言推理任务。它支持多种功能,包括 speech-to-text、text-to-speech 和大型语言模型处理。用户可以访问官方文档和社区讨论,以优化其在该平台上的使用体验。