GPT-OSS ist eine Familie von Open-Source-Sprachmodellen von OpenAI, darunter die Versionen gpt-oss-120b und gpt-oss-20b mit 117 Milliarden bzw. 210 Milliarden Parametern. Die Familie ist unter der Apache-2.0-Lizenz lizenziert, die es Entwicklern erlaubt, sie kostenlos herunterzuladen, zu verändern und einzusetzen.
Die wichtigsten Merkmale sind:
- Effiziente Inferenz: Mit MXFP4-Quantisierung läuft gpt-oss-120b auf einem einzigen Nvidia H100-Grafikprozessor, gpt-oss-20b passt sich an 16-GB-RAM-Geräte an.
- Chained Reasoning: unterstützt niedrige, mittlere und hohe Reasoning-Stärken, die je nach Aufgabenanforderung angepasst werden können
- Tool-Aufruf: integrierte Websuche, Ausführung von Python-Code, Dateimanipulation usw.
- Strukturierte Ausgabe: Verwendung des proprietären Harmony-Antwortformats zur Erleichterung von Fehlersuche und Nutzung
- Unterstützung für lange Kontexte: 128k Kontextlänge wird von Haus aus unterstützt.
Diese Antwort stammt aus dem ArtikelGPT-OSS: OpenAIs quelloffenes großes Modell für effizientes ReasoningDie