海外访问：www.kdjingpai.com

Ctrl + D 收藏本站

当前位置：首页 » AI答疑

如何在自己的设备上运行MiniMind-V的完整训练流程？

2025-08-25

1.0 K

运行MiniMind-V需要按照环境配置→数据准备→模型训练→效果测试四个步骤进行系统化操作：

环境配置

使用git clone下载项目代码，建议Python≥3.9环境
通过清华镜像源安装依赖：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
下载CLIP视觉编码器到./model/vision_model目录

数据准备

创建./dataset目录并下载约5GB的预训练数据
需包含三种JSONL格式标注文件（预训练/单图微调/多图微调）和对应图片
图像默认会resize到224×224分辨率

模型训练

典型流程包含两个阶段：

预训练：运行train_pretrain_vlm.py冻结CLIP只训练投影层（约1小时/epoch）
微调：执行train_sft_vlm.py解冻语言模型进行端到端训练

效果测试

支持两种验证方式：

命令行交互：python eval_vlm.py加载训练权重
Web界面：python web_demo_vlm.py启动本地服务进行可视化测试

关键提示：若显存不足（＜24GB），需在LMConfig.py中调小batch_size参数。

本答案来源于文章《MiniMind-V：1小时训练26M参数视觉语言模型》

相关文章

未经允许不得转载：AI生产力工具 » 如何在自己的设备上运行MiniMind-V的完整训练流程？

相关推荐