Os seguintes elementos precisam ser levados em conta para obter o efeito de clonagem de fala desejado:
- Duração da amostraÉ necessário ter pelo menos 5 minutos de gravações claras no idioma materno (recomenda-se de 10 a 15 minutos).
- ambiente de gravaçãoEspaço silencioso, evite ruídos de fundo, microfone externo recomendado
- Requisitos de conteúdodeve cobrir o discurso diário defonema inteiro(Sugestão de leitura em voz alta de textos que contêm várias pronúncias)
- expressão afetiva: a inclusão de diferentes tons, como calmo/excitado/questionador, contribui para a autenticidade do clone
Após a conclusão do upload, o sistema executaráExtração de recursos de impressão vocalresponder cantandoModelagem rítmicaque normalmente leva de 2 a 4 horas de treinamento. A voz resultante da IA pode reproduzir com precisão a voz do usuárioCaracterísticas acústicas acima de 97%incluindo ritmos respiratórios e hábitos de pausa exclusivos.
Essa resposta foi extraída do artigoHeyGen: uma ferramenta que ajuda você a gerar vídeos explicativos humanos digitais multilínguesO