Um programa de progressão em três etapas para otimizar a sincronização da boca
A sincronização demográfica digital se baseia em técnicas de análise de assinatura de fala, que podem ser usadas para aprimorar a correspondência das seguintes maneiras:
- Pré-processamento de texto
- Evite declarações longas e consecutivas (recomenda-se não mais do que 15 palavras em uma única frase)
- Insira uma pausa de 0,3 a 0,5 segundo após um sinal de pontuação (usando a função "Insert Pause")
- Dividir a terminologia complexa em frases (por exemplo, "ácido ribonucleico" para "ácido ribonucleico")
- ajuste de parâmetros
- Selecione o tipo de voz "âncora de notícias padrão" (esse tipo de biblioteca tem os dados mais completos sobre o formato dos lábios).
- Manter uma velocidade de fala de 180 a 220 palavras por minuto (as estações de trabalho são ajustáveis em tempo real)
- Ative o "Accurate Mouth Mode" (requer um aumento no tempo de renderização de 30%)
- alteração no pós-processamento
- Faça o ajuste fino do formato da boca do quadro-chave usando a função "calibração quadro a quadro"
- Palavras importantes podem ser substituídas por palavras simples sinônimas (por exemplo, "weak" (fraco) por "thin" (magro)).
- Certifique-se de fazer uma demonstração de 5 segundos do clipe antes da saída final.
Observação: A dublagem de dialetos e idiomas estrangeiros requer a seleção do modelo humano digital do idioma correspondente, e o modelo em mandarim não pode ser adaptado a outros idiomas.
Essa resposta foi extraída do artigoCyberSmart: conversão de texto em fala e vídeo humano digitalO