Step3は、StepFunによって開発され、GitHubでホストされているオープンソースのマルチモーダル・マクロモデリング・プロジェクトです。その中核となるのは、効率的かつコスト効率の高いテキスト、画像、音声コンテンツ生成機能を提供するために設計された、321億パラメータ(38億アクティブパラメータ)の混合専門家モデル(MoE)である。
主な特徴は以下の通り:
- マルチモーダルコンテンツ生成のサポート(テキスト、画像、音声)
- リアルタイムアプリケーションのための効率的な推論最適化
- OpenAIとAnthropic互換のAPIインターフェースを提供
- モデルの重みはbf16とblock-fp8形式で保存され、ハードウェアの必要性を低減する。
- vLLMやSGLangなどの推論フレームワークのサポート
- Apache 2.0ライセンスによる完全なオープンソース
この答えは記事から得たものである。Step3: マルチモーダルコンテンツのためのオープンソースマクロモデルの効率的な生成について
































