PyTorch部署指南
通过PyTorch框架使用Hibiki需要以下步骤:
- 环境准备:
- 安装最新版moshi包:
pip install -U moshi
- 确保PyTorch版本兼容bf16运算(需GPU支持)
- 安装最新版moshi包:
- 模型获取:
- 下载示例音频:
wget https://github.com/kyutai-labs/moshi/raw/main/data/sample_fr_hibiki_crepes.mp3
- 选择1B或2B参数模型(2B需更高计算资源)
- 下载示例音频:
- 执行翻译:
- 基础命令:
python -m moshi.run_inference 输入文件.mp3 输出.wav --hf-repo kyutai/hibiki-1b-pytorch-bf16
- 调整语音保留度:添加
--cfg-coef 3
参数(范围1-5)
- 基础命令:
注意:实际部署时需考虑音频输入设备配置和实时缓冲设置。
本答案来源于文章《Hibiki:实时语音翻译模型,保留原声特点的流式翻译》