海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

如何在自己的设备上运行MiniMind-V的完整训练流程?

2025-08-25 1.0 K

运行MiniMind-V需要按照环境配置→数据准备→模型训练→效果测试四个步骤进行系统化操作:

环境配置

  • 使用git clone下载项目代码,建议Python≥3.9环境
  • 通过清华镜像源安装依赖:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 下载CLIP视觉编码器到./model/vision_model目录

数据准备

  • 创建./dataset目录并下载约5GB的预训练数据
  • 需包含三种JSONL格式标注文件(预训练/单图微调/多图微调)和对应图片
  • 图像默认会resize到224×224分辨率

模型训练

典型流程包含两个阶段:

  1. 预训练:运行train_pretrain_vlm.py冻结CLIP只训练投影层(约1小时/epoch)
  2. 微调:执行train_sft_vlm.py解冻语言模型进行端到端训练

效果测试

支持两种验证方式:

  • 命令行交互:python eval_vlm.py加载训练权重
  • Web界面:python web_demo_vlm.py启动本地服务进行可视化测试

关键提示:若显存不足(<24GB),需在LMConfig.py中调小batch_size参数。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文