A versão v4 do Demucs apresenta uma série de importantes aprimoramentos técnicos que melhoram significativamente a qualidade e o desempenho da separação de trilhas:
Inovação tecnológica essencial::
- A tecnologia Hybrid Transformer foi introduzida para combinar a arquitetura Transformer com as CNNs tradicionais
- Usa uma arquitetura convolucional U-Net mais avançada
- Algoritmo de separação aprimorado para reduzir a interferência entre as trilhas
aprimoramento do desempenho::
- Melhoria significativa na precisão da separação em comparação com a v3
- Melhor separação de músicas complexas
- Otimizado especialmente para a separação de faixas vocais e de apoio
novo recurso::
- Adicionada modelagem experimental de seis faixas (com guitarra e piano)
- Opção de modelo ajustado (htdemucs_ft) fornecida
- Suporte otimizado para várias plataformas de hardware
Esses aprimoramentos tornam a versão v4 particularmente adequada para produção musical, geração de karaokê e cenários de análise de áudio profissional. Para o usuário comum, a versão v4 também oferece melhor separação padrão e mantém uma velocidade de processamento relativamente boa.
Essa resposta foi extraída do artigoDemucs: ferramenta gratuita de código aberto para separar faixas de músicaO