Der Open-Source-Charakter von Step3 bietet eine kostengünstige Lösung:
- Keine LizenzierungskostenDas Apache 2.0-Protokoll erlaubt die freie kommerzielle Nutzung ohne Lizenzbeschränkungen.
- Einsparungen bei der HardwareBlock-fp8-Format ermöglicht es einem einzigen Server (4*A800), Millionen von Anfragen pro Tag zu unterstützen
- Vereinfachung des EinsatzesEine vollständige GitHub-Dokumentation im Gesang antworten Discord-Gemeinschaftetw. unterstützen
Durchführungsweg:
- Modellgewichte von Hugging Face herunterladen (~210GB)
- auf der Grundlage von
deploy/
Katalog von Kubernetes-Konfigurationsvorlagen zum Aufbau von Clustern - Leistungsüberwachung mit der mitgelieferten Prometheus-Überwachungsvorlage
In der Praxis hat sich gezeigt, dass die TCO (Total Cost of Ownership) des 80% gegenüber vergleichbaren kommerziellen Lösungen sinken.
Diese Antwort stammt aus dem ArtikelSchritt 3: Effiziente Generierung von quelloffenen Makromodellen für multimodale InhalteDie