当前位置：首页 » AI答疑

MIDI-3D的预训练模型权重支持真实与卡通风格的双重输入适配

2025-08-28

1.4 K

该工具设计的模型架构具有出色的风格泛化能力，其公开的预训练权重包含以下关键特性：

技术文档显示，模型在CVPR 2025测试集上达到：真实图片86.7%的生成质量评分（FID指标），卡通图片82.3%的语义保持度（CLIP-Score）。用户只需通过Hugging Face自动下载权重文件，无需额外训练即可获得跨风格的生成能力。

实际案例中，输入一张儿童绘本插图，系统能准确识别夸张的比例特征，生成的3D模型保留了原画的Q版造型特点。

快速查询站内AI工具