参数调优策略
核心调节--cfg
参数控制文本-图像对齐度,该值越大模型越严格遵循提示词。官方推荐初始值为4.0,可逐步提高至7.0测试效果。
提示词工程技巧
- 使用英文描述:虽然支持中文,但训练数据以英文为主
- 添加细节修饰:如”4K超清”/”专业摄影”等质量描述词
- 结构化表达:按照”主体+环境+风格”格式组织提示词
后续优化方案
- 多轮编辑:通过
generate_examples
中的编辑脚本逐步修正 - 主题微调:使用TRAIN.md指南加载特定领域数据进行训练
- 混合控制:结合MoVQGAN的潜在空间控制功能精确调整特征
Essa resposta foi extraída do artigoLumina-mGPT-2.0: um modelo autorregressivo de geração de imagens para lidar com várias tarefas de geração de imagensO