支持的语音服务类型
- 开源模型:如Zyphra/Zonos-v0.1-hybrid(需本地GPU资源)
- 商业API:OpenAI兼容服务(kokoros.transformrs.org)
- 第三方平台:DeepInfra等(需API密钥)
配置方法
- 密钥设置:
export DEEPINFRA_KEY="你的密钥"
- 服务指定:
- 基础命令:
--provider=openai-compatible(kokoros.transformrs.org)
- 模型选择:
--model=tts-1
- 音色参数:
--voice=bm_lewis
- 基础命令:
- 音频输出:可指定
--audio-format=wav
等格式
注意不同服务的语音风格和费用差异,建议先测试样本再批量生成。
本答案来源于文章《TRV:将幻灯片/PPT和讲解备注快速生成演讲视频》