保持图像细节的技术方案
针对Diffusion Transformer可能产生的细节模糊问题,可采取以下措施:
- 启用VAE增强:确保正确加载vae.safetensors文件(335MB),该变分自编码器可重构高频细节,需放置在
models/step1x
目录 - 控制生成步数:在
run_inference.py
脚本中增加--num_inference_steps 50
参数(默认30步),虽然会增加20%计算时间,但显著改善发丝、纹理等细节 - 后期处理方案:使用官方推荐的Real-ESRGAN进行超分辨率重建,可通过附加命令安装:
pip install realesrgan
实验数据表明,结合VAE和50步推理可使1024×1024图像的PSNR指标提升3.2dB
本答案来源于文章《Step1X-Edit:自然语言指令编辑图像的开源工具》