A seguinte configuração otimizada do Docker é recomendada para atender aos requisitos do ambiente de produção:
- Restrições de recursos: em
docker-compose.ymlAdicionar em:deploy:
resources:
limits:
cpus: '2'
memory: 1G - check-up de saúdeConfiguração da sonda de serviço: Configure a sonda de serviço:
healthcheck:
test: ['CMD-SHELL', 'curl -f http://localhost:8005/docs || exit 1']
interval: 30s - Armazenamento persistenteMonte o diretório de cache do modelo:
volumes:
- ./model_cache:/app/model_cache
Programas altamente disponíveis:
- fazer uso de
docker-compose scale tts=3Criação de várias instâncias - Para configurar o balanceamento de carga com o Nginx, uma configuração de amostra está incluída no projeto
examples/diretório (no disco rígido do computador) - Configure a rotação de registros:
logging:
driver: 'json-file'
options:
max-size: '10m'
Essa resposta foi extraída do artigoKitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantávelO































