Análise do problema
Os vocais gerados por IA geralmente sofrem com um forte senso de mecânica, e o SongGen oferece duas opções de otimização:
Programa de clonagem de som
- pretender3 segundos de vocais limposAmostra (sugerida sem música de fundo)
- configurarseparate=TrueOs parâmetros separam automaticamente os vocais do áudio de referência
- Os modelos aprenderão as características tonais e as transferirão para novas músicas
Programa de otimização de parâmetros
- adaptardo_sample=TrueAtivar amostragem aleatória
- Aumento adequado na geração detemperaturaParâmetros (recomendado 0,7-1,0)
- Adicionar ao texto da letraDicas de pronúncia(por exemplo, palavras em inglês rotuladas foneticamente)
advertência
É desejável selecionar amostras para o áudio de referência que correspondam ao clima da música-alvo.
Essa resposta foi extraída do artigoSongGen: um transformador autorregressivo de estágio único para geração automática de músicasO































