使用CogView4生成高分辨率(如2048×2048)图像时需特别注意以下方面:
Requisitos de hardware
- 基础分辨率(1024×1024):至少需要16GB显存
- 高分辨率(2048×2048):建议24GB以上显存
Dicas de otimização de desempenho
- 显存管理:
– 启用pipe.enable_model_cpu_offload()
卸载部分计算到CPU
- fazer uso depipe.vae.enable_slicing()
responder cantandoenable_tiling()
分片处理 - 数据类型优化:
– 将torch_dtype
configurado comotorch.float16
节约显存
质量与速度权衡
- crescente
num_inference_steps
(50-100步)可提升质量但延长耗时 - 适当提高
guidance_scale
(3.5-7.0)可增强细节但可能降低创意性
Conselhos práticos
对于大尺寸图像,建议先在低分辨率下测试效果(512×512),确认满意后再提升分辨率,以节省测试时间。如遇显存溢出,可尝试减小批次大小或降低分辨率。
Essa resposta foi extraída do artigoCogView4: um modelo gráfico de código aberto para gerar imagens bilíngues de alta definição em chinês e inglêsO