Geração de conteúdo criativo com base em imagens de referência
A funcionalidade de gráfico para gráfico do CloudFlare-AI-Image foi criada com base no trabalho colaborativo de imagens carregadas e dicas textuais. O sistema primeiro extrai os vetores de recursos da imagem de referência por meio de um codificador visual e, em seguida, combina-os com dicas textuais para reorganização do conteúdo no espaço latente.
Os cenários típicos de aplicação incluem:
- Conversão de estilo: converta fotos em estilo de desenho animado ou pintura a óleo
- Extensão de conteúdo: geração de cenas completas com base em esboços parciais
- Aprimoramento da qualidade: detalhes aprimorados em imagens de baixa resolução
A implementação técnica suporta a transmissão de dados de imagem codificados em Base64, e o grau de reescrita pode ser controlado especificando o parâmetro de intensidade ao fazer a chamada por meio da API. Por exemplo, o upload de fotos de edifícios com o prompt "futuristic city" (cidade futurista) pode gerar imagens de edifícios com um senso de ficção científica. Na prática, recomenda-se manter a consistência do tema entre a imagem de referência e a palavra-chave, e o sistema prioriza a resposta aos comandos de texto em caso de conflito entre os dois.
Esse recurso é particularmente adequado para que os designers gerem soluções criativas rapidamente, com testes que mostram um tempo médio de 12 segundos entre o upload e a geração (com base no modelo SD-XL).
Essa resposta foi extraída do artigoScripts de geração de imagens de IA baseados em trabalho da CloudflareO































