Soluções técnicas para obter integridade estrutural musical de nível profissional
O YuE oferece uma solução sistemática para o problema da estrutura musical da IA:
- Modelagem de contexto longoA arquitetura especialmente projetada do Transformer suporta a geração de sequências de música de até vários minutos de duração.
- técnica de bissecçãoCodificação simultânea de sinais de música e texto de letras, mantendo ambos os tempos alinhados
- método de treinamento em três estágiosEstrutura em nível de vinheta: aprender a estrutura em nível de vinheta, depois dominar as transições de parágrafo e, por fim, otimizar o desempenho detalhado
Guia de operação::
- Separe claramente as passagens da música principal, do refrão, etc. com linhas em branco no arquivo de letras
- Recomenda-se usar uma estrutura de música padrão, como: introdução - lead 1 - refrão - lead 2 - refrão - coda
- O parâmetro -structure pode ser adicionado para aprimorar a diferenciação de parágrafos durante a geração (por exemplo, -structure clear).
Tratamento de exceçõesSe ainda ocorrerem problemas estruturais, você pode 1) mudar para a geração de segmentos de letras mais curtos 2) diminuir o valor do parâmetro -creativity (padrão 0,7) e 3) ajustar manualmente a sequência das passagens posteriormente com um software de áudio. O modelo também tem um mecanismo integrado de detecção de duplicatas para evitar o looping excessivo de uma única frase.
Essa resposta foi extraída do artigoYuE: Transforma as letras em um modelo básico de uma música completa, suportando uma ampla variedade de estilos musicaisO































