Avanços tecnológicos na arquitetura de computação em nuvem
Implantada na AWS e na arquitetura dual-live da AliCloud, a Malette Art usa os mais recentes clusters híbridos NVIDIA A100 e RTX 4090 para fornecer até 160 TFLOPS de potência de computação em uma única placa. O algoritmo de agendamento de tarefas inteligente exclusivo da plataforma aloca dinamicamente recursos aritméticos com base na complexidade do fluxo de trabalho: uma tarefa simples de geração de imagem recebe uma fatia de 1/4 da GPU, enquanto a renderização de vídeo 4K ocupa toda a placa. Esse mecanismo de alocação flexível reduz o tempo médio de espera da tarefa em 681 TP3T, enquanto aumenta a utilização de recursos para mais de 851 TP3T.
Os usuários estão completamente livres de limitações de dispositivos locais e podem concluir o processamento de superpontuação de 8K por meio de um navegador em um laptop comum. A plataforma adota um modelo de cobrança sob demanda, com funções básicas gratuitas e tarefas de nível profissional cobradas com precisão de segundo nível (US$ 0,003/segundo). As medições mostram que o custo total da geração de 20 imagens de 1024×1024 economiza 92% de consumo de energia e 87% de depreciação de hardware em comparação com a compra de uma placa gráfica.
Essa resposta foi extraída do artigoMalette Art: uma plataforma de criação baseada em IA para imagens e vídeos gerados por fluxo de trabalhoO