O ambiente a seguir precisa ser preparado antes da implementação:
- sistema básicoWindows 10/11 (64 bits) ou Linux (recomendado Debian/Ubuntu)
- Ambiente PythonVersão 3.10 e superior
- Componentes necessáriosFerramenta de gerenciamento de código Git e mecanismo de fonemas eSpeak NG
- Aceleração de GPU (opcional)Placa de vídeo NVIDIA necessária e driver CUDA instalado
Atenção especial:
- Os usuários do Windows precisam instalar o arquivo espeak-ng-X.XX-x64.msi após a instalação doReinicie o terminal
- Os usuários do Linux precisam executar o comando
sudo apt install espeak-ng libsndfile1 ffmpegInstalação de dependências - Os usuários de GPU precisam configurar adicionalmente o NVIDIA Container Toolkit (para implantação do Docker)
Essa resposta foi extraída do artigoKitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantávelO

































