Requisitos de instalação
O Muyan-TTS precisa ser executado em um ambiente Linux, sendo recomendado o sistema Ubuntu. As principais dependências incluem Python 3.10, FFmpeg e outras ferramentas.
Etapas de instalação
- Clonagem de repositórios do GitHub:
git clone https://github.com/MYZY-AI/Muyan-TTS.git - Crie um ambiente virtual conda:
conda create -n muyan-tts python=3.10 -y - Instale as dependências do projeto:
make build - Faça o download de modelos pré-treinados (requer aproximadamente 20 GB de espaço de armazenamento)
Requisitos de hardware
- ambiente de inferênciaGPU NVIDIA A100 (40 GB) ou equivalente recomendada
- Ambiente de treinamentoClusters de GPU com várias placas necessários para o pré-treinamento (custo total de treinamento de aproximadamente US$ 50.000)
- Requisitos de memóriaMemória gráfica da GPU de pelo menos 16 GB necessária para a inferência do modelo básico
Opções de implementação
Oferece suporte à implementação de API local (porta padrão 8020), que pode ser acessada por meio dopython api.pyLançar serviços para facilitar a integração em vários aplicativos.
Essa resposta foi extraída do artigoMuyan-TTS: treinamento e síntese de fala em podcasts personalizadosO































