Duas soluções para a falta de memória de vídeo do Demucs
Ao usar o Demucs para processar áudio de alta resolução, você pode encontrar problemas de memória de vídeo insuficiente na placa de vídeo. Aqui estão duas soluções:
Opção 1: Otimização dos parâmetros de processamento
- fazer uso de
--segment 8
para reduzir os requisitos de memória, que divide o áudio em segmentos de 8 segundos para processamento - aumentar
--two-stems
Os parâmetros extraem somente faixas específicas (por exemplo, somente vocais), reduzindo a quantidade de cálculos. - fazer uso de
-j 4
Computação auxiliar de CPU com vários núcleos habilitada por parâmetros para compartilhar a pressão da GPU
Opção 2: Troca de dispositivos de computação
- Forçar cálculos da CPU: adicionar
-d cpu
parâmetros - Definição de variáveis de ambiente
PYTORCH_NO_CUDA_MEMORY_CACHING=1
Desativar o cache de memória CUDA - Para usuários de Mac, o
-d mps
Ativar a aceleração do Apple Metal
Dica adicional: a redução da taxa de amostragem dos arquivos WAV para 44,1 kHz também pode reduzir significativamente o consumo de memória. Recomenda-se dar prioridade às soluções de CPU quando a memória de vídeo for inferior a 3 GB.
Essa resposta foi extraída do artigoDemucs: ferramenta gratuita de código aberto para separar faixas de músicaO