A otimização computacional da YuE permite recursos de aplicativos de nível industrial
O YuE é profundamente otimizado para computação de GPU, o que lhe permite lidar com eficiência com tarefas de geração de músicas de sequência longa. O modelo integra a tecnologia FlashAttention 2, que economiza 40% de memória de GPU em comparação com as arquiteturas de transformador padrão, possibilitando a geração de músicas completas com até 5 minutos de duração em placas gráficas de consumo.
A otimização se concentra em três aspectos principais: primeiro, suporte nativo para o ambiente CUDA, que faz uso total do poder de computação paralela da GPU; segundo, aprimoramentos no projeto de processamento em lote, que permite a geração paralela de várias músicas de estilos diferentes na mesma GPU; e, por último, otimização do gerenciamento de memória, que lida com sequências de áudio ultralongas por meio de técnicas de fragmentação dinâmica.
Os dados de medição mostram que, em uma placa de vídeo NVIDIA A100, o YuE gera uma música de 3 minutos em 90 segundos, o que é três vezes mais rápido do que tecnologias semelhantes. Essa capacidade de geração eficiente a torna ideal para plataformas de criação de música, sistemas de trilha sonora de jogos e outros cenários de aplicativos que exigem geração em tempo real.
Essa resposta foi extraída do artigoYuE: Transforma as letras em um modelo básico de uma música completa, suportando uma ampla variedade de estilos musicaisO































