安装流程分为三个核心步骤:
- 下载模型权重:通过Hugging Face平台获取,例如运行
huggingface-cli download openai/gpt-oss-20b
指令 - 配置Python环境:需Python 3.12以上版本,建议使用虚拟环境,安装
transformers
、accelerate
等基础依赖包 - 部署运行:可选择四种主流方式:
- 使用Transformers库直接加载模型
- 通过vLLM框架启动OpenAI兼容服务器
- 在Ollama中拉取模型镜像运行
- Apple Silicon设备需额外转换权重为Metal格式
特别注意:必须安装配套的gpt-oss
包并启用Harmony格式,否则模型无法正常工作。
本答案来源于文章《GPT-OSS:OpenAI开源的高效推理大模型》