安装 R1-Onevision 需要一定的技术基础,以下是详细的安装配置指南:
环境要求
- 操作系统:推荐 Linux (如 Ubuntu) 或 Windows 配合 WSL
- 硬件:建议 NVIDIA GPU (至少 16GB 显存,如 A100 或 RTX 3090)
安装步骤
- 基础环境:安装 Python 3.8+、PyTorch (GPU 版) 和 Git
- 克隆仓库:
git clone https://github.com/Fancy-MLLM/R1-Onevision.git
- 安装依赖:进入项目目录运行
pip install -r requirements.txt
- 可选加速:安装 Flash Attention 以加速推理
模型下载与验证
- 从 Hugging Face 下载预训练模型权重到项目目录下的 models 文件夹
- 验证 CUDA 可用性:运行 Python 检查
torch.cuda.is_available()
应返回 True
本答案来源于文章《R1-Onevision:支持多模态推理的开源视觉语言模型》