Programa de garantia de qualidade
A qualidade da saída do modelo de 4 bits pode ser efetivamente mantida pelos seguintes meios técnicos:
- Tratamento de outlier SVD::
- Identificação automática de outliers em matrizes de peso
- Os autovalores acima de 95% são preservados pela decomposição de baixa classificação
- Compensação de precisão híbrida::
- Use o cálculo FP16 para a camada de atenção (precisa ser configurado)
attn_precision=fp16) - O decodificador VAE força o uso do FP32 (por meio do
force_full_precision_vae=True)
- Use o cálculo FP16 para a camada de atenção (precisa ser configurado)
- Otimização do pós-processamento::
- Carregue a extensão ADetailer para corrigir automaticamente os detalhes faciais
- Reconstrução de super-resolução com TileDiffusion
Dados de comparação do mundo real:
- No modelo FLUX.1-schnell, a pontuação FID para a versão quantificada de 4 bits é de 18,7 contra 17,2 para a versão original
- A análise humana mostra que uma leve faixa de cor só pode ser observada quando se dá zoom no 400%
Recomendações operacionais:
1. para itens críticos, primeiro gere 256 x 256 esboços
2. adoçãohq_upscale=2.0Parâmetros para 2x superscoring
3) Por fim, aplique o próprio NunchakuDebandFilternodal
Essa resposta foi extraída do artigoNunchaku: uma ferramenta de inferência para executar com eficiência os modelos quantificados de 4 bits FLUX.1 e SANAO































