MegaTTS3的安装需要以下步骤:
1. preparação ambiental
- 推荐使用Python 3.9版本
- 建议通过Conda创建独立环境:
conda create -n megatts3-env python=3.9
conda activate megatts3-env
2. 代码获取
- Clonagem de repositórios do GitHub:
git clone https://github.com/bytedance/MegaTTS3.git
cd MegaTTS3
3. instalação de dependências
- 一键安装依赖项:
pip install -r requirements.txt
4. downloads de modelos
- 从Google Drive或Hugging Face下载预训练模型
- 将model.pth放入./checkpoints/目录
- 下载对应的latents文件放置在同一目录
5. verificação da instalação
运行测试命令确认安装成功:python tts/infer_cli.py --input_wav 'assets/Chinese_prompt.wav' --input_text "测试" --output_dir ./gen
Essa resposta foi extraída do artigoMegaTTS3: um modelo leve para sintetizar a fala em chinês e inglêsO