O GPT-OSS é uma família de modelos de linguagem de código aberto lançada pela OpenAI, que contém principalmente dois modelos: gpt-oss-120b e gpt-oss-20b. O gpt-oss-120b tem 117 bilhões de parâmetros e é adequado para execução em data centers ou dispositivos de ponta, podendo ser acionado por uma única GPU Nvidia H100; o gpt-oss-20b tem 21 bilhões de parâmetros, otimizado para cenários de baixa latência, e pode ser executado em dispositivos com 16 GB de RAM. Ambos os modelos são licenciados sob a licença de código aberto Apache 2.0, permitindo que os desenvolvedores façam download, modifiquem e implementem livremente.
Os principais recursos incluem: suporte para raciocínio encadeado (em força baixa/média/alta), invocação de ferramenta (por exemplo, pesquisa na Web/execução de código), saída estruturada (formato Harmony), capacidade de processamento de contexto de 128k e segurança de modelo por meio de treinamento seguro e auditoria externa.
Essa resposta foi extraída do artigoGPT-OSS: Grande modelo de código aberto da OpenAI para raciocínio eficienteO