Dicas práticas para a desmecanização
Uma abordagem fundamental para a realização da fala natural:
- Otimização de combinações de parâmetros::
- Ajuste o controle deslizante "Naturalness" (Naturalidade) para a faixa de 75-85%.
- Adicionar 2-3% Flutuações aleatórias da taxa de fala
- Configuração do passo de 0,8-1,21 TP3T para variar aleatoriamente - Pré-processamento de texto::
1. adicione uma pausa de 200-300ms após a pontuação (dois pontos estendidos para 500ms)
2. insira tags [ênfase] antes de palavras importantes.
3. leituras mistas de números ("2024" é lido como "vinte e vinte e quatro") - Pós-processamentoAjuste manualmente o padrão de acentuação usando a ferramenta Rhythm of Sound do Adobe Audition ou adicione um som ambiente de fundo suave (por exemplo, Café Noise -24dB).
Critérios de teste de eficácia: faça a reprodução cruzada do áudio gerado com uma gravação ao vivo para garantir que os testadores de pelo menos 70% não consigam distinguir com precisão entre eles.
Essa resposta foi extraída do artigoAnyVoice: clonagem de voz on-line gratuita em apenas 3 segundos!O































