A tecnologia de separação de fontes sonoras de IA usada pela AIMusic tem três vantagens revolucionárias em relação ao software de desvocalização tradicional:
- algoritmo de aprendizado profundoUtilizando uma versão aprimorada da arquitetura de rede neural Demucs, treinada em milhões de músicas, ele reconhece e separa componentes vocais complexos, incluindo harmonias e sons de respiração.
- Processamento de som sem perdasA bateria de baixa frequência e os detalhes instrumentais de alta frequência da música original são mantidos ao máximo, enquanto os vocais são eliminados, e a taxa de perda de som do acompanhamento é inferior a 5% após a separação.
- Capacidade de processamento em tempo realA música pode ser processada em 90 segundos para uma música de 3 minutos de duração, enquanto o software tradicional leva mais de 10 minutos e suporta o processamento de upload em lote.
Os testes mostram que, para músicas como "Seven Miles", de Jay Chou, em que os vocais e as faixas de apoio são altamente integrados, o AIMusic ainda é capaz de extrair faixas de apoio com uma pureza de 92%. A tecnologia também é adequada para extrair efeitos sonoros ambientais em diálogos de filmes e TV, o que a torna uma ferramenta revolucionária para o pós-processamento de áudio.
Essa resposta foi extraída do artigoAIMusic: uma ferramenta de criação gratuita para gerar músicas, letras e vídeos com IAO































