仓库提供两个模型:gpt-oss-120b
(117B参数)和gpt-oss-20b
(21B参数)。选择模型时需考虑硬件条件:
- 高性能GPU(如H100):推荐使用
gpt-oss-120b
,需至少80GB GPU内存。 - 消费级硬件(如16GB内存设备):推荐使用
gpt-oss-20b
,资源占用较低。
在脚本中通过修改model_path
变量选择模型,例如:
model_path = "openai/gpt-oss-20b" # 选择20B模型
# model_path = "openai/gpt-oss-120b" # 选择120B模型
脚本会根据模型大小自动配置设备映射和优化设置。
本答案来源于文章《微调OpenAI GPT OSS模型的脚本和教程集合》