参数调优策略
核心调节--cfg
参数控制文本-图像对齐度,该值越大模型越严格遵循提示词。官方推荐初始值为4.0,可逐步提高至7.0测试效果。
提示词工程技巧
- 使用英文描述:虽然支持中文,但训练数据以英文为主
- 添加细节修饰:如”4K超清”/”专业摄影”等质量描述词
- 结构化表达:按照”主体+环境+风格”格式组织提示词
后续优化方案
- 多轮编辑:通过
generate_examples
中的编辑脚本逐步修正 - 主题微调:使用TRAIN.md指南加载特定领域数据进行训练
- 混合控制:结合MoVQGAN的潜在空间控制功能精确调整特征
本答案来源于文章《Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型》