A arquitetura Mixed Expert (MoE) usada no Wan2.2 é, de fato, uma inovação importante. Essa arquitetura permite que diferentes modelos de especialistas se concentrem em suas respectivas áreas de especialização, separando o processo de redução de ruído nos estágios de alto e baixo ruído. Os especialistas em alto ruído se especializam em processos de redução de ruídos grosseiros nos estágios iniciais mais ruidosos, enquanto os especialistas em baixo ruído se concentram na otimização da qualidade da imagem nos estágios posteriores. Essa divisão de trabalho permite que o Wan2.2 mantenha a eficiência computacional e, ao mesmo tempo, melhore significativamente a qualidade da geração. Em comparação com um único modelo, a arquitetura MoE permite que o Wan2.2 aumente a utilização de dados de treinamento em mais de 60%, oferecendo suporte a movimentos mais complexos e renderização de efeitos estéticos de maior qualidade.
Essa resposta foi extraída do artigoWan2.2: Modelo de geração de vídeo de código aberto com suporte eficiente a texto e imagem para vídeoO































