Soluções técnicas para manter os detalhes da imagem
As medidas a seguir podem ser tomadas para solucionar o embaçamento de detalhes que pode ocorrer com o Diffusion Transformer:
- Ativar o aprimoramento do VAECarga: Garanta o carregamento corretovae.safetensors(335 MB), esse autocodificador variacional reconstrói detalhes de alta frequência que precisam ser colocados no arquivo
models/step1xdiretório (no disco rígido do computador) - Controle do número de etapas de geração: em
run_inference.pyScript para adicionar--num_inference_steps 50(padrão 30 etapas), o que aumenta o tempo de cálculo do 20%, mas melhora significativamente os detalhes do cabelo, da textura etc. - Programa de pós-processamentoUse o produto oficialmente recomendadoReal-ESRGANExecuta a reconstrução de super-resolução, que pode ser instalada com comandos adicionais:
pip install realesrgan
Os dados experimentais mostram que a combinação de VAE e inferência de 50 etapas melhora a métrica PSNR de imagens 1024×1024 em 3,2 dB
Essa resposta foi extraída do artigoStep1X-Edit: uma ferramenta de código aberto para editar imagens com instruções em linguagem naturalO































