As etapas a seguir são necessárias para a instalação do MegaTTS3:
1. preparação ambiental
- Recomenda-se o Python 3.9.
- Recomenda-se criar um ambiente autônomo por meio do Conda:
conda create -n megatts3-env python=3.9
conda activate megatts3-env
2. aquisição de código
- Clonagem de repositórios do GitHub:
git clone https://github.com/bytedance/MegaTTS3.git
cd MegaTTS3
3. instalação de dependências
- Instale as dependências com um clique:
pip install -r requirements.txt
4. downloads de modelos
- Faça o download de modelos pré-treinados do Google Drive ou do Hugging Face
- Coloque o arquivo model.pth no diretório . /checkpoints/
- Faça o download do arquivo de latentes correspondente e coloque-o no mesmo diretório.
5. verificação da instalação
Execute o comando de teste para confirmar a instalação bem-sucedida:python tts/infer_cli.py --input_wav 'assets/Chinese_prompt.wav' --input_text "测试" --output_dir ./gen
Essa resposta foi extraída do artigoMegaTTS3: um modelo leve para sintetizar a fala em chinês e inglêsO































