Step3 ist ein von StepFun entwickeltes, quelloffenes, multimodales Makromodell, zu dessen wichtigsten technischen Merkmalen gehören:
- Verwendung der Mixed Model of Expertise (MoE)-Architektur mit 32,1 Milliarden Gesamtparametern (3,8 Milliarden aktive Parameter), wodurch Geschwindigkeit und Leistung der Schlussfolgerungen erheblich optimiert wurden
- Multimodale Inhaltserstellungsfunktionen, die Text, Bilder und Sprache unterstützen
- Modellgewichte werden sowohl im bf16- als auch im block-fp8-Format gespeichert, was die Hardwareanforderungen reduziert.
- Standardisierte API-Schnittstelle, die mit OpenAI und Anthropic kompatibel ist
Das Projekt ist unter der Apache 2.0 Open-Source-Lizenz lizenziert, die es Entwicklern erlaubt, den Code und die Modellgewichte frei zu nutzen, zu verändern und zu verbreiten. Diese Lizenz gibt den Entwicklern die Flexibilität, den Code sowohl für kommerzielle als auch für Forschungszwecke zu nutzen und spiegelt die Philosophie von StepFun wider, die Entwicklung von KI durch Open Source zu fördern.
Diese Antwort stammt aus dem ArtikelSchritt 3: Effiziente Generierung von quelloffenen Makromodellen für multimodale InhalteDie