A saída final do Demucs é influenciada tanto pela configuração dos parâmetros quanto pela qualidade do material de origem. Os usuários profissionais precisam se certificar de que obtêm a melhor separação possível com as configurações corretas, o que é especialmente importante em aplicações de nível comercial.
As principais influências de qualidade incluem:
- Formato de entrada: recomendam-se arquivos WAV sem perdas; formatos com perdas, como MP3, perderão detalhes de alta frequência.
- Seleção do modelo: o modelo de ajuste fino htdemucs_ft melhora a precisão da separação em cerca de 151 TP3T em comparação com a versão básica
- Características de áudio: arranjos complexos exigem um valor de segmento maior; recomendamos definir -segmento 10 ou mais.
- Configuração de hardware: o processamento de GPU reduz o ruído artefatual em cerca de 30%, especialmente eficaz para a separação vocal
Os testes demonstraram que o processamento de arquivos WAV de 24 bits/96 kHz usando o modelo htdemucs_ft resulta em uma qualidade de separação próxima à dos plug-ins de áudio profissional em placas de vídeo RTX 4080. Essa qualidade controlável torna o Demucs adaptável a uma ampla gama de necessidades, desde amadores até estúdios profissionais.
Essa resposta foi extraída do artigoDemucs: ferramenta gratuita de código aberto para separar faixas de músicaO