A instalação e a implantação do Step1X-Edit são divididas principalmente em três etapas: preparação do ambiente, download do modelo e execução do teste:
- ambiente de baseRequisitos: requer Linux (recomenda-se o Ubuntu 20.04+), Python 3.10+ e kit de ferramentas CUDA 12.1
- Requisitos de memória de vídeoA edição Standard requer 80 GB de memória de vídeo (classe NVIDIA H800), a edição FP8 Quantised pode ser reduzida para 16 GB (adaptada para RTX 3090 Ti)
- Processo de instalação::
- Crie um ambiente conda:
conda create -n step1x python=3.10 - Instalação do PyTorch 2.3.1 e das bibliotecas dependentes
- Instalação opcional do Flash Attention para acelerar o raciocínio
- Crie um ambiente conda:
- Download do modeloPara o modelo principal, são necessários 24,9 GB de pesos, 335 MB de modelo VAE e modelo multimodal Qwen-VL-7B da Hugging Face.
Para os usuários do ComfyUI, os pesos do modelo podem ser integrados por meio de um plug-in após serem colocados em um diretório especificado. É importante observar que o consumo de memória varia significativamente de acordo com a resolução: 512×512 requer 42 GB de memória (5 segundos para gerar) e 1024×1024 requer 50 GB de memória (22 segundos para gerar).
Essa resposta foi extraída do artigoStep1X-Edit: uma ferramenta de código aberto para editar imagens com instruções em linguagem naturalO































