Explicação das funções profissionais de processamento de imagens
Além do texto básico para gerar imagens, a plataforma oferece quatro funções avançadas principais para atender às necessidades profissionais:
- Otimização de upscaleSelecione uma determinada versão (numerada de 1 a 4) da imagem gerada inicialmente para aprimoramento de detalhes, por exemplo:
curl -X POST /upscale -d '{"hash":"[id da tarefa]", "choice" :2}' - Região variávelEspecifique a área de coordenadas na imagem gerada (primeiro precisa ser Upscale), com a nova palavra-chave redesenho local, aplicável ao produto para alterar o plano de fundo e outros cenários.
- Creative Derivative Model (Remix)Quando a interface /prefer está ativada, a palavra-chave pode ser repetida mantendo o estilo do desenho original, o que é particularmente adequado para a evolução dos conceitos de design.
- Geração de descrição reversa (Descreva)Carregar imagens para obter 4 descrições de texto para fornecer uma direção inspiradora para modificações subsequentes
Pontos a observar: Todas as funções de edição precisam se basear na ID da tarefa de imagem gerada inicialmente, portanto, é recomendável usar /imagine para criar a imagem base primeiro. A edição de região requer um entendimento do sistema de coordenadas do Discord (coordenadas padronizadas 0-1), que é ilustrado em detalhes na documentação. Para usuários de comércio eletrônico, com o Upscale + Vary Region é possível obter uma rápida transformação em lote de imagens de produtos.
Essa resposta foi extraída do artigoUserAPI.ai: integração da interface da API de geração de imagens do MidjourneyO































