Como funciona o recurso de clonagem de voz do VisionStory? O que fazer e o que não fazer?

2025-08-27

311

Link diretoVisualização móvel

Há três etapas principais para usar o recurso Voice Clone:

Preparação do somGrave cerca de 1 minuto de áudio nítido em um ambiente silencioso (recomenda-se um microfone profissional), que deve conter um diálogo natural com diferentes tons e ritmos
Fazer upload do treinamentoClique em "Clone Your Voice" (Clonar sua voz) no menu de seleção de voz, carregue arquivos WAV/MP3 e o sistema extrairá os recursos de impressão de voz por meio de uma rede neural profunda (o tempo de processamento é de cerca de 15 a 30 minutos).
Aplicações sintéticasQuando o treinamento for concluído, o clone aparecerá na biblioteca de sons privada do usuário, que poderá ser selecionada para uso em qualquer projeto de vídeo

Observações importantes:

O uso comercial garante a propriedade de todos os direitos autorais do conteúdo gravado
A qualidade da gravação afeta diretamente o efeito de clonagem, e recomenda-se que a taxa de amostragem não seja inferior a 44,1 kHz.
O sistema suporta a clonagem dos principais idiomas, como chinês e inglês, mas dialetos ou pronúncias especiais podem afetar a precisão
Os usuários podem excluir modelos de voz a qualquer momento nas configurações da conta