Die Modellgewichte von Step3 werden in den Formaten bf16 und block-fp8 gespeichert, die die Speicher- und Berechnungseffizienz der Modellgewichte optimieren. Entwickler können diese Gewichte von der Hugging Face-Plattform herunterladen und das passende Format für ihre Bedürfnisse auswählen. Diese Optimierung reduziert die Hardwareanforderungen und eignet sich besonders für den Einsatz in Multi-GPU-Umgebungen, z. B. bei Verwendung von vier A800/H800-GPUs mit 80 GB Grafikspeicher für optimale Leistung.
Diese Antwort stammt aus dem ArtikelSchritt 3: Effiziente Generierung von quelloffenen Makromodellen für multimodale InhalteDie