O recurso de edição encadeada do Qwen-Image-Edit representa o estado da arte atual em processamento interativo de imagens com IA. Esse recurso permite que o usuário refine progressivamente a imagem para obter o resultado desejado por meio de várias rodadas de comandos de texto progressivos. Ao contrário de um modelo de edição única, ele lembra o estado da modificação anterior e continua a fazer ajustes com base nele.
Os cenários de aplicação específicos incluem a correção palavra por palavra de caligrafia, otimização iterativa de rascunhos de design e assim por diante. Por exemplo, os usuários podem primeiro modificar o estilo geral de uma imagem para aquarela, depois ajustar a cor de elementos específicos e, por fim, fazer o ajuste fino dos efeitos de luz e sombra. Cada etapa do comando é executada com base na conclusão da etapa anterior, garantindo um processo de edição coerente e controlável.
Esse recurso é realizado por meio do mecanismo de memória do modelo e da função de retenção de estado. Ele é capaz de reter os resultados intermediários da sequência anterior de edições e, ao mesmo tempo, compreender com precisão o significado específico das instruções subsequentes no contexto atual da imagem. Essa edição progressiva melhora muito a eficiência de modificações complexas de imagens.
Essa resposta foi extraída do artigoQwen-Image-Edit: modelo de IA para edição de imagens com base em comandos textuaisO