A otimização do efeito de geração pode ser feita de três maneiras:
Ganhos de eficiência
- Usar aceleração multithread: por exemplo.
python app/createAudio.py --threads 20para iniciar 20 threads. - Processamento distribuído: 5 máquinas medidas em paralelo podem processar 2.000 capítulos em 5 horas.
Melhoria da qualidade
- Substituição do mecanismo TTS: o CosyVoice2-0.5B padrão tem efeito limitado; é possível integrar um modelo de síntese de fala melhor.
- Revisão do manual: por
gui.pyferramenta para verificar a ordem e a integridade do áudio.
Tratamento de erros
- Reexecutar em caso de interrupção da rede
getZjList.pyPercorra os capítulos que faltam. - Considere o uso de um servidor proxy para alternar IPs quando você encontrar restrições de IP.
Observação: Há limitações de chamadas de API para modelos in silico, e a geração em larga escala exige um planejamento razoável do agendamento de tarefas.
Essa resposta foi extraída do artigoUma ferramenta para rastrear automaticamente romances e gerar audiolivros com vários caracteresO































