Os seguintes pontos devem ser observados para obter os melhores resultados de conversão de músicas:
preliminar
- Seleção de áudio de referência limpo sem ruído de fundo (amostras de cantores)
- Certifique-se de que as músicas sejam gravadas em boa qualidade (recomenda-se 16 bits/44 kHz ou mais)
parametrização
- começar a usar
f0-conditionpara preservar a assinatura de tom original - Etapas de difusão definidas como 30-50 para obter uma qualidade de som mais fina.
- fazer uso de
seed-uvit-whisper-baseVocais de processamento de modelagem (200 milhões de parâmetros)
Técnicas avançadas
- Habilita para gravações com pouca afinação
auto-f0-adjustcorreção automática de voz - aprovar (um projeto de lei ou inspeção etc.)
semi-tone-shiftAjuste fino do tom para corresponder a diferentes faixas de cantores - O processamento do coro pode ser convertido e sintetizado em vozes separadas.
Observe que o sistema fará o download de 44kHz por padrãoseed-uvit-whisper-baseque é, de longe, a melhor opção para a conversão de músicas.
Essa resposta foi extraída do artigoSeed-VC: suporta a conversão em tempo real de fala e música com menos amostrasO































