利用CogView4生成含有汉字的图像需要以下步骤:
基础代码示例
创建一个Python文件(如generate.py),包含以下代码:
from diffusers import CogView4Pipeline
import torch
pipe = CogView4Pipeline.from_pretrained("THUDM/CogView4-6B",
torch_dtype=torch.bfloat16).to("cuda")
汉字生成实现
- 在提示词中明确包含中文文字要求
- 示例:
prompt = "一张写有'欢迎体验CogView4'的广告海报,背景是蓝天白云"
- 指定输出尺寸:
image = pipe(prompt=prompt, width=1024, height=1024).images[0]
- 保存结果:
image.save("poster.png")
优化建议
- 对于复杂汉字,可增加
guidance_scale
值(3.5-7.0) - 适当增加
num_inference_steps
(建议50-100步) - 显存不足时可使用
enable_model_cpu_offload()
本答案来源于文章《CogView4:生成中英双语高清图片的开源文生图模型》