Soluções otimizadas para dispositivos de baixa configuração:
- Forçar modo de baixa memória: Uso
generate_lowmem.sh
Os scripts substituem os scripts padrão, reduzindo os requisitos de memória da GPU para 10 GB - Desativar a atenção ao flash: Adicionar
--not_use_flash_attn
Parâmetros para placas de vídeo mais antigas que não suportam CUDA 11.8 - Simplificar o conteúdo de entradaEvite usar áudio de referência e descrições de texto ao mesmo tempo para reduzir a complexidade computacional do modelo.
- Usando imagens do Docker: Official Mirror
juhayna/song-generation-levo:hf0613
Os parâmetros de otimização foram pré-configurados por--network=host
Redução da pegada de recursos - Geração passo a passoA primeira é uma faixa de música pura, depois os vocais são gerados separadamente e, por fim, sintetizados com ferramentas de áudio.
Essa resposta foi extraída do artigoSongGeneration: um modelo de IA de código aberto para gerar músicas e letras de alta qualidadeO