GPT-OSS ist eine von OpenAI ins Leben gerufene Familie von Open-Source-Sprachmodellen, die im Wesentlichen zwei Modelle umfasst: gpt-oss-120b und gpt-oss-20b. gpt-oss-120b hat 117 Milliarden Parameter und eignet sich für den Einsatz in Rechenzentren oder High-End-Geräten und kann von einem einzigen Nvidia H100-Grafikprozessor betrieben werden. gpt-oss-20b hat 21 Milliarden Parameter, ist für Szenarien mit niedriger Latenz optimiert und kann auf Geräten mit 16 GB RAM ausgeführt werden. Beide Modelle stehen unter der Apache 2.0 Open-Source-Lizenz zur Verfügung, so dass Entwickler sie frei herunterladen, verändern und einsetzen können.
Zu den wichtigsten Merkmalen gehören: Unterstützung für verkettete Schlussfolgerungen (in niedriger/mittlerer/hoher Stärke), Toolaufrufe (z. B. Websuche/Codeausführung), strukturierte Ausgabe (Harmony-Format), 128k lange Kontextverarbeitungsfähigkeit und Modellsicherheit durch sicheres Training und externe Prüfung.
Diese Antwort stammt aus dem ArtikelGPT-OSS: OpenAIs quelloffenes großes Modell für effizientes ReasoningDie