Step3 是一个由 StepFun 开发的开源多模态大模型,其核心技术特点包括:
- 采用混合专家模型(MoE)架构,总参数达 321 亿(活跃参数 38 亿),显著优化了推理速度和性能
- 支持文本、图像和语音的多模态内容生成能力
- 模型权重提供 bf16 和 block-fp8 两种存储格式,降低硬件需求
- 兼容 OpenAI 和 Anthropic 的标准化 API 接口
该项目采用 Apache 2.0 开源许可,允许开发者自由使用、修改和分发代码及模型权重。这种许可方式赋予开发者极大的灵活性,可用于商业和研究用途,充分体现了 StepFun 通过开源推动人工智能发展的理念。
本答案来源于文章《Step3:高效生成多模态内容的开源大模型》