Step3是由StepFun开发的一个开源多模态大模型项目,托管在GitHub上。它的核心是一个321亿参数(38亿活跃参数)的混合专家模型(MoE),旨在提供高效、经济的文本、图像和语音内容生成能力。
主要特点包括:
- 支持多模态内容生成(文本、图像和语音)
- 高效推理优化,适合实时应用
- 提供OpenAI和Anthropic兼容的API接口
- 模型权重以bf16和block-fp8格式存储,降低硬件需求
- 支持vLLM和SGLang等推理框架
- 完全开源,采用Apache 2.0许可
本答案来源于文章《Step3:高效生成多模态内容的开源大模型》