O Demucs v4, uma versão histórica, alcança um avanço na tecnologia de separação de trilhas ao integrar a arquitetura do Hybrid Transformer. Essa tecnologia combina o mecanismo de auto-atenção do Transformer com redes neurais convolucionais tradicionais para melhorar significativamente os recursos de extração de recursos e levar a precisão da separação a níveis líderes do setor.
As realizações específicas incluem:
- Suporta a separação de seis trilhas: vocais, kit de bateria, baixo, outros vocais de apoio, guitarra e piano.
- Diferenças na seleção de modelos: modelos ajustados pelo htdemucs_ft com a mais alta precisão, o htdemucs_6s oferece suporte a recursos experimentais de seis trilhas
- Otimização do tempo de processamento: o tempo de processamento de áudio é cerca de 1,5 vez maior do que o tempo original, em comparação com a versão v3 do aumento de eficiência de 30%
- Requisitos de memória gráfica: recomenda-se 3 GB ou mais de memória da GPU, que pode ser otimizada por meio do consumo de recursos do parâmetro -segment
Essa versão é particularmente adequada para a produção musical profissional, permitindo a extração precisa de faixas de instrumentos específicos para a criação de remixes.
Essa resposta foi extraída do artigoDemucs: ferramenta gratuita de código aberto para separar faixas de músicaO