GPT-OSS 是 OpenAI 推出的开源语言模型系列,包括 gpt-oss-120b 和 gpt-oss-20b 两个版本,分别拥有 1170 亿和 210 亿参数。该系列采用 Apache 2.0 许可,允许开发者免费下载、修改和部署。
主要特点包括:
- 高效推理:采用 MXFP4 量化技术,gpt-oss-120b 可在单 Nvidia H100 GPU 上运行,gpt-oss-20b 适配 16GB 内存设备
- 链式推理:支持低、中、高三种推理强度,可根据任务需求调整
- 工具调用:集成网页搜索、Python 代码执行和文件操作等功能
- 结构化输出:使用专有的 Harmony 响应格式,便于调试和使用
- 长上下文支持:原生支持 128k 上下文长度
本答案来源于文章《GPT-OSS:OpenAI开源的高效推理大模型》