3 maneiras principais de melhorar a precisão da separação de demônios
A qualidade da fonte de áudio e a escolha dos parâmetros afetam diretamente a separação, e as práticas recomendadas são as seguintes:
1. seleção do melhor modelo
- priorização
-n htdemucs_ft
Ajuste fino do modelo (versão v4) - Música complexa para experimentar
-n htdemucs_6s
Modelagem de seis trilhas para separar mais instrumentos - Recomenda-se o uso de música clássica
-n mdx_extra
Modelos dedicados
2. otimização da qualidade dos insumos
- Use o formato WAV sem perdas em vez de MP3 para reduzir a perda de compactação
- Garanta uma taxa de amostragem de áudio ≥ 44,1 kHz
- Remoção da parte sem som do front-end de áudio
3. técnicas de ajuste fino de parâmetros
- aumentar
--float32
Melhore a precisão com cálculos de ponto flutuante de 32 bits - Evite usar
--segment
Os parâmetros cortam segmentos muito pequenos (recomenda-se ≥10 segundos) - aprovar (um projeto de lei ou inspeção etc.)
--shifts=2
Aumentar o número de previsões (o que aumentará o tempo de processamento)
Os testes mostraram que o uso da combinação WAV+htdemucs_ft pode melhorar a precisão da separação em cerca de 151 TP3T em relação à configuração padrão.
Essa resposta foi extraída do artigoDemucs: ferramenta gratuita de código aberto para separar faixas de músicaO