PyTorch部署指南
通过PyTorch框架使用Hibiki需要以下步骤:
- Preparação ambiental::
- 安装最新版moshi包:
pip install -U moshi
- 确保PyTorch版本兼容bf16运算(需GPU支持)
- 安装最新版moshi包:
- Aquisição de modelos::
- 下载示例音频:
wget https://github.com/kyutai-labs/moshi/raw/main/data/sample_fr_hibiki_crepes.mp3
- 选择1B或2B参数模型(2B需更高计算资源)
- 下载示例音频:
- Tradutor executivo::
- Comando Base:
python -m moshi.run_inference 输入文件.mp3 输出.wav --hf-repo kyutai/hibiki-1b-pytorch-bf16
- 调整语音保留度:添加
--cfg-coef 3
参数(范围1-5)
- Comando Base:
注意:实际部署时需考虑音频输入设备配置和实时缓冲设置。
Essa resposta foi extraída do artigoHibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz originalO