Step1X-Edit是由Stepfun AI团队开发的开源图像编辑框架,通过自然语言指令实现对图像的智能化编辑。它结合了多模态大语言模型(Qwen-VL)responder cantando扩散变换器(DiT)两大核心技术,主要具有以下核心功能:
- 自然语言交互编辑:支持”更改背景””移除物体”等文本指令
- compreensão multimodal:通过Qwen-VL精准解析图像内容与用户指令
- Geração de alta qualidade:基于DiT保持原始图像细节的编辑效果
- Suporte quantitativo:提供FP8量化版本降低硬件门槛
- avaliação comparativa:内置GEdit-Bench评估真实场景下的编辑性能
该框架采用Apache 2.0许可证,既支持学术研究也允许商业应用。相较于闭源方案如GPT-4o,虽然在效果上尚有差距,但其开源特性为开发者提供了高度可定制化的解决方案。
Essa resposta foi extraída do artigoStep1X-Edit: uma ferramenta de código aberto para editar imagens com instruções em linguagem naturalO