Há três etapas principais para usar o recurso Voice Clone:
- Preparação do somGrave cerca de 1 minuto de áudio nítido em um ambiente silencioso (recomenda-se um microfone profissional), que deve conter um diálogo natural com diferentes tons e ritmos
- Fazer upload do treinamentoClique em "Clone Your Voice" (Clonar sua voz) no menu de seleção de voz, carregue arquivos WAV/MP3 e o sistema extrairá os recursos de impressão de voz por meio de uma rede neural profunda (o tempo de processamento é de cerca de 15 a 30 minutos).
- Aplicações sintéticasQuando o treinamento for concluído, o clone aparecerá na biblioteca de sons privada do usuário, que poderá ser selecionada para uso em qualquer projeto de vídeo
Observações importantes:
- O uso comercial garante a propriedade de todos os direitos autorais do conteúdo gravado
- A qualidade da gravação afeta diretamente o efeito de clonagem, e recomenda-se que a taxa de amostragem não seja inferior a 44,1 kHz.
- O sistema suporta a clonagem dos principais idiomas, como chinês e inglês, mas dialetos ou pronúncias especiais podem afetar a precisão
- Os usuários podem excluir modelos de voz a qualquer momento nas configurações da conta
Essa resposta foi extraída do artigoVisionStory: geração de vídeos explicativos com IA a partir de imagens e textosO





























