Step3 ist ein Open-Source-Projekt zur multimodalen Makromodellierung, das von StepFun entwickelt und auf GitHub gehostet wird. Kernstück ist ein 32,1 Milliarden Parameter (3,8 Milliarden aktive Parameter) umfassendes Model of Mixed Experts (MoE), das für eine effiziente und kostengünstige Generierung von Text-, Bild- und Sprachinhalten entwickelt wurde.
Die wichtigsten Merkmale sind:
- Unterstützung für multimodale Inhaltserstellung (Text, Bilder und Sprache)
- Effiziente Inferenzoptimierung für Echtzeitanwendungen
- Bietet eine mit OpenAI und Anthropic kompatible API-Schnittstelle
- Modellgewichte werden in den Formaten bf16 und block-fp8 gespeichert, um die Hardwareanforderungen zu reduzieren
- Unterstützung für Inferenz-Frameworks wie vLLM und SGLang
- Vollständig quelloffen mit Apache 2.0-Lizenz
Diese Antwort stammt aus dem ArtikelSchritt 3: Effiziente Generierung von quelloffenen Makromodellen für multimodale InhalteDie

































