Solução para o problema de vozes incompatíveis em várias funções
Ao usar o Auto-Audio-Book para gerar um audiolivro, você pode se deparar com situações em que a voz não corresponde às configurações do personagem. Veja a seguir uma solução passo a passo:
- Priorizar os principais participantes: através de
python app/createUser.pyO script define os atributos de voz do personagem principal. Marque explicitamente os personagens principais (por exemplo, protagonista, narrador) na configuração JSON, e é recomendável usar a biblioteca de sons de alta qualidade do CosyVoice2-0.5B. - Processamento graduado de volume de linha::
- Os caracteres com mais de 50 linhas devem receber parâmetros de voz individuais
- Os personagens secundários podem reutilizar a voz do narrador, mas ajustar o parâmetro de tom (modificação)
config/voice_settings.json)
- Sessão de teste de som: Executar
python app/test_voice.py chapter1.jsonGerar clipes de amostra, ouvir o ajuste do efeito e, em seguida, a geração em lote
Solução complementar: se o modelo interno não estiver funcionando bem, ele poderá ser modificado substituindo o mecanismo TTS (por exemplo, Azure Neural TTS) e modificando oaudio_generator.pyO módulo de síntese de fala no
Essa resposta foi extraída do artigoUma ferramenta para rastrear automaticamente romances e gerar audiolivros com vários caracteresO































