Step3のモデルウェイトはbf16とblock-fp8形式で保存され、モデルウェイトの保存と計算効率を最適化します。開発者はHugging Faceプラットフォームからこれらの重みをダウンロードし、ニーズに応じて適切なフォーマットを選択することができます。この最適化によりハードウェア要件が削減され、最適なパフォーマンスを得るために80GBのグラフィックス・メモリを搭載した4つのA800/H800 GPUを使用するなど、マルチGPU環境での展開に特に適しています。
この答えは記事から得たものである。Step3: マルチモーダルコンテンツのためのオープンソースマクロモデルの効率的な生成について