O GPT-OSS é uma família de modelos de linguagem de código aberto da OpenAI, incluindo as versões gpt-oss-120b e gpt-oss-20b com 117 bilhões e 210 bilhões de parâmetros, respectivamente. A família está licenciada sob a licença Apache 2.0, que permite que os desenvolvedores façam download, modifiquem e implementem gratuitamente.
Os principais recursos incluem:
- Inferência eficiente: usando a quantificação MXFP4, o gpt-oss-120b é executado em uma única GPU Nvidia H100, o gpt-oss-20b se adapta a dispositivos de 16 GB de RAM.
- Raciocínio em cadeia: suporta forças de raciocínio baixas, médias e altas, que podem ser ajustadas de acordo com os requisitos da tarefa
- Invocação de ferramentas: pesquisa integrada na Web, execução de código Python, manipulação de arquivos, etc.
- Saída estruturada: usa o formato de resposta proprietário do Harmony para facilitar a depuração e o uso
- Suporte a contextos longos: o comprimento do contexto de 128k é suportado nativamente.
Essa resposta foi extraída do artigoGPT-OSS: Grande modelo de código aberto da OpenAI para raciocínio eficienteO