O CloudFlare-AI-Image é um projeto de código aberto hospedado no GitHub que fornece serviços gratuitos de geração de imagens de IA por meio da plataforma Cloudflare Workers. Ele oferece suporte a recursos gerados por texto e por gráficos com base em cinco modelos, incluindo Fluxo.1 [schnell], Stable Diffusion XL, etc. O SD-XL-Base-CF é usado por padrão. Os usuários podem gerar imagens de alta qualidade inserindo descrições de texto ou carregando imagens de referência. A interface do projeto é compatível com o formato OpenAI, o que facilita a integração e a implantação para desenvolvedores, designers e entusiastas criativos. Com a rede global da Cloudflare, a velocidade de geração é rápida e estável, e o código-fonte é aberto e pode ser modificado livremente.

Lista de funções
- Suporte a imagens de texto para gerar, insira a descrição do texto para gerar imagens de alta qualidade.
- Oferece suporte a imagens geradas por gráficos para gerar novas imagens com base em imagens de referência carregadas.
- Cinco modelos opcionais são fornecidos: DS-8-CF, SD-XL-Bash-CF, SD-XL-Lightning-CF, FLUX.1-Schnell-CF, SF-Kolors.
- API REST compatível com o formato OpenAI para facilitar a integração em aplicativos de terceiros.
- Parâmetros de geração personalizáveis, como estilo de imagem, número de etapas e resolução.
- Implantado no Cloudflare Workers, não são necessários servidores gerenciados.
- Oferece suporte ao armazenamento KV para armazenar em cache as imagens geradas.
- Código-fonte aberto, modificável pelo usuário e extensível.
Usando a Ajuda
Processo de instalação
Para usar o CloudFlare-AI-Image, você precisa concluir as seguintes etapas de implantação. O processo é simples, mas requer uma configuração cuidadosa de seu ambiente.
- Registre-se em uma conta da Cloudflare
Visite o site oficial da Cloudflare para se registrar ou entrar em uma conta. O plano gratuito é suficiente para dar suporte a este projeto. Certifique-se de que a conta tenha permissões de namespace Workers AI e KV. - Clonagem do código do projeto
Execute o seguinte comando no terminal para clonar o projeto localmente:git clone https://github.com/justlovemaki/CloudFlare-AI-Image.gitVá para o catálogo de projetos:
cd CloudFlare-AI-Image - Instalação do Wrangler
O Wrangler é uma ferramenta para implantar o Cloudflare Workers. Comando de instalação:npm install -g @cloudflare/wranglerFaça login no Wrangler:
wrangler loginSiga as instruções para autorizar em seu navegador.
- Configuração de variáveis de ambiente
O projeto precisa vincular os namespaces Workers AI e KV e configurar as informações da conta.- Faça login no painel do Cloudflare e localize o ID da conta.
- Crie tokens de API com permissões para incluir IA do Workers, edição de scripts do Workers e armazenamento de KV.
- compilador
wrangler.tomlcom o ID da conta e o namespace KV:account_id = "你的账户ID" name = "cloudflare-ai-image" compatibility_date = "2023-09-01" [[kv_namespaces]] binding = "IMAGE_KV" id = "你的KV命名空间ID" - Criar um espaço de nome KV:
wrangler kv:namespace create IMAGE_KVCopie a ID retornada e preencha o campo
wrangler.toml. - Defina o token da API:
wrangler secret put CLOUDFLARE_API_TOKENDigite seu token de API.
- (Opcional) Defina SF_TOKEN se estiver usando um modelo de estágio de fluxo baseado em silício:
wrangler secret put SF_TOKENInsira o token de API solicitado da Silicon Mobility Platform.
- Projetos de implantação
Execute no diretório do projeto:wrangler publishDepois de uma implementação bem-sucedida, obtenha o URL dos trabalhadores, por exemplo
https://cloudflare-ai-image.your-account.workers.dev. - teste local
Se a depuração local for necessária, execute:wrangler devIsso iniciará o servidor local e acessará o arquivo
http://localhost:8787Função de teste.
Uso
Depois de implantado, você pode usar a geração de imagens por meio da API, do cliente ou do URL do Workers. Aqui estão instruções detalhadas sobre como fazer isso.
Selecione o modelo
O projeto suporta cinco modelos, sendo que o FLUX.1-Schnell-CF é recomendado para obter melhores resultados, mas há um limite de uso diário. Outros modelos estão listados abaixo:
- DS-8-CFBaseado no Dreamshaper-8-LCM, é adequado para gerar rapidamente imagens de estilo artístico.
- SD-XL-Bash-CFModelo padrão, baseado no Stable Diffusion XL, equilibrando velocidade e qualidade.
- SD-XL-Lightning-CFOtimizado para velocidade e adequado para cenários simples.
- FLUX.1-Schnell-CFModelo de alta qualidade, rico em detalhes, recomendado para cenas complexas.
- SF-KolorsBaseado em Kwai-Kolors, adequado para imagens de estilo asiático, SF_TOKEN precisa ser configurado.
Ao selecionar um modelo, especifique o nome do modelo na solicitação de API ou no arquivo de configuração, por exemplo "model": "@cf/black-forest-labs/flux-1-schnell".
Diagrama de Vincennes
Os diagramas de Venn geram imagens a partir de descrições textuais.
- via API::
Chame o ponto de extremidade da API usando uma solicitação POST:curl -X POST https://your-project.workers.dev/api/generate \ -H "Content-Type: application/json" \ -d '{"prompt": "一片星空下的雪山,月光照耀", "model": "@cf/black-forest-labs/flux-1-schnell", "steps": 8}'Retorna JSON contendo o URL da imagem ou dados Base64.
- através do cliente::
A interface do projeto é compatível com o formato OpenAI e pode ser usada com clientes habilitados para OpenAI, como ChatGPT (Cliente). Configure o endereço da API do cliente para ser o URL de seus funcionários e digite o prompt para gerar a imagem. - via URL dos trabalhadores::
entrevistashttps://your-project.workers.devdigite a palavra de prompt, clique em Generate e o navegador exibirá a imagem.
Otimizar palavras de alerta::
As palavras-chave claras melhoram a qualidade da imagem. Exemplo:
- Difuso:
"一朵花" - Otimização:
"一朵盛开的红玫瑰,背景是绿色草地,阳光明媚"
As dicas em inglês podem funcionar melhor, como"A red rose in bloom on a green meadow under bright sunlight".
Tucson (cidade)
As tuplas geram novas imagens com base em imagens de referência.
- via API::
Faça upload de uma imagem e forneça uma palavra-chave:curl -X POST https://your-project.workers.dev/api/generate \ -H "Content-Type: application/json" \ -d '{"prompt": "将这张图片变成卡通风格", "image": "base64编码的图像数据", "model": "@cf/stabilityai/stable-diffusion-xl-base-1.0"}' - via URL dos trabalhadores::
Visite a página, faça upload de uma imagem de referência, insira uma descrição (por exemplo"卡通风格") para gerar uma nova imagem.
Parâmetros personalizados
Há suporte para o ajuste dos seguintes parâmetros:
- EtapasPadrão 8, intervalo de 1 a 50, etapas mais altas fornecem mais detalhes, mas aumentam o consumo de tempo.
- resolução (de uma foto)Padrão: 512 x 512, ajustável para 1024 x 1024 (dependendo do suporte do modelo).
- penteadoControlado por palavras-chave, como
"油画风格"e"赛博朋克".
Adicione parâmetros à solicitação de API:
{
"prompt": " futuristic city at night",
"steps": 12,
"width": 1024,
"height": 1024
}
Opções de tradução forçada
- -ntlDesativar a tradução e manter as palavras originais do prompt para usuários multilíngues.
- -tlTradução forçada de palavras de prompt para o inglês para melhorar a qualidade da geração.
Na solicitação de API, adicione"translate": "tl"talvez"translate": "ntl".
Ver registro
Faça login no painel da Cloudflare e acesse a visão geral dos Workers para ver os registros de solicitação, os registros de geração e o uso de recursos.
advertência
- cota livreO plano gratuito do Cloudflare Workers de 100.000 solicitações por dia é suficiente para suportar o uso pessoal. Pode haver limites adicionais nas chamadas de modelo para o Workers AI (por exemplo, limite diário para FLUX.1).
- Desempenho do modeloO FLUX.1-Schnell-CF funciona melhor, mas pode ser limitado em cargas elevadas. O SD-XL-Bash-CF é adequado para uso diário.
- segurançaRecomenda-se definir a chave de API para evitar acesso não autorizado.
- Restrições de palavras-chavePara evitar conteúdo sensível ou inadequado, os modelos são filtrados automaticamente.
cenário do aplicativo
- criação de conteúdo
Os blogueiros precisam ilustrar suas postagens, inserir"一片热带雨林,阳光穿透树叶"A versão mais recente do produto é aquela que gera imagens de alta qualidade em segundos, economizando dinheiro em custos de design. - desenvolvimento de aplicativos
O desenvolvedor gera um mapa de exibição de produtos para a plataforma de comércio eletrônico, que é chamado dinamicamente por meio da API, e insere descrições como"现代风格的沙发,白色背景"para aprimorar a experiência do usuário. - Descoberta da arte
O aluno ou artista faz upload de um esboço, usa o diagrama para gerar um diagrama e insere o"赛博朋克风格"A empresa está sempre pronta para gerar um trabalho exclusivo para estudo ou apresentação. - Educação e treinamento
Os professores geram materiais de instrução, como insumos"古代中国的城市街道"usado em cursos de história para visualizar cenas.
QA
- Quanto tempo leva para gerar uma imagem?
De 2 a 15 segundos, dependendo do modelo, do número de etapas e da rede. O flux.1-schnell-cf é o mais rápido, o sd-xl-bash-cf é um pouco mais lento. - Quais tipos de imagem são compatíveis?
Oferece suporte a paisagens, pessoas, objetos, estilos de arte, etc. Cenas complexas precisam ser otimizadas para palavras-chave e o conteúdo sensível será filtrado. - Tenho que pagar pela implantação?
Não é necessário. O projeto é de código aberto e o plano gratuito da Cloudflare é suficiente. Os modelos SF-Kolors exigem um aplicativo SF_TOKEN gratuito. - Como faço para trocar de modelo?
Especifique o nome do modelo na solicitação de API ou modifique o modelo padrão no arquivo de configuração. Recomenda-se testar o FLUX.1-Schnell-CF. - Como funciona o recurso Tupelo?
Faça upload de uma imagem de referência, insira uma descrição (por exemplo"卡通风格"), gerando novas imagens por meio da API ou de uma página.






























