Os seguintes pontos devem ser observados ao usar o SongGeneration:
- prompt de entradaEvite o fornecimento simultâneo de
prompt_audio_path
responder cantandodescriptions
Caso contrário, a qualidade da geração pode ser prejudicada devido a conflitos. - Formato das letrasA letra precisa ser estruturada em seções (por exemplo
[verse]
e[chorus]
), segmentos não-líricos (como[intro-short]
) não deve conter letras. - Áudio de referênciaRecomenda-se usar o refrão da música (10 segundos ou menos) para otimizar a musicalidade.
- Requisitos de hardware: 10 GB de memória da GPU para o modelo básico e 16 GB com áudio de referência.
Essa resposta foi extraída do artigoSongGeneration: um modelo de IA de código aberto para gerar músicas e letras de alta qualidadeO