O Qwen-Image permite o gerenciamento modular do fluxo de trabalho por meio da integração nativa com o ComfyUI. Os usuários precisam baixar a versão mais recente do ComfyUI e instalar difusores, PyTorch e outras dependências. A recomendação oficial é usar a RTX 4090D (24 GB de RAM) para obter o melhor desempenho, a primeira execução consome cerca de 86% de recursos de RAM e leva cerca de 94 segundos para ser gerada.
Depois que o fluxo de trabalho é carregado, o usuário pode controlar o efeito de geração definindo a palavra de sinalização (recomendada para adicionar uma descrição de qualidade, como Ultra HD 4K), ajustando a escala CFG (4.0 recomendada), fixando a semente aleatória, etc. A versão do ModelScope suporta um esquema de baixa otimização gráfica com 4 GB de VRAM como alternativa.
Essa resposta foi extraída do artigoQwen-Image: uma ferramenta de IA para gerar imagens de alta fidelidade com renderização precisa de textoO