数据合成与模型训练的技术创新
UNO的数据处理系统包含两大核心技术:首先是基于扩散模型的智能数据增强流程,能够从单张参考图像自动生成多视角、多场景的训练样本;其次是引入了主体感知(subject-aware)的数据采样策略,确保多主体场景中每个实体的特征都能被均衡学习。
在训练策略上,团队采用三阶段优化方案:先基于大规模通用数据预训练,再用合成数据微调,最后采用对抗训练提升细节质量。这种方案使得模型仅需1-4张参考图像就能达到85%以上的特征保持率。项目开源的训练代码支持自定义数据集的finetune,研究人员可通过修改configs/training.yaml配置文件快速启动新任务。
This answer comes from the articleUNO: Support for single-subject and multi-subject customized image generation tools (suitable for e-commerce graphics)The