Posição atual:fig. início " Biblioteca de ferramentas de IA

GPT-Image-Edit: ferramenta para editar e gerar imagens usando comandos de texto

2025-07-30

Biblioteca de ferramentas de IA/Pintura com IA/edição de imagens

852 13

https://github.com/wyhlovecpp/GPT-Image-Edit

fazer uma cópia de

Link diretoVisualização móvel

O GPT-Image-Edit é uma ferramenta de código aberto hospedada no GitHub e desenvolvida pelo usuário wyhlovecpp (Yuhan Wang). Ela se baseia na tecnologia de geração de imagens da OpenAI e permite que os usuários gerem ou editem imagens com comandos de texto simples. A ferramenta é adequada para desenvolvedores, designers ou usuários interessados no processamento de imagens de IA. O projeto oferece uma interface intuitiva que permite aos usuários fazer upload de imagens e implementar modificações na imagem por meio de texto descritivo, como alterar o plano de fundo, adicionar objetos ou ajustar o estilo. Seu principal ponto forte é que ele combina o poder dos recursos de processamento de imagens da IA com um processo simples para iniciar rapidamente. O projeto ainda está em desenvolvimento, e o código e a documentação estão disponíveis publicamente para incentivar as contribuições e o feedback da comunidade.

Lista de funções

Gerar imagens totalmente novas com comandos de texto.
Suporta o upload de imagens e sua edição com base em descrições de texto.
Oferece funções de conversão de estilo de imagem, como a conversão de imagens em estilos de desenho animado ou arte.
Oferece suporte ao processamento em lote de imagens, adequado para tarefas de edição em grande escala.
Código-fonte aberto com funcionalidade definida pelo usuário ou integração em outros projetos.
Fornecer uma interface de API simples para os desenvolvedores chamarem.

Usando a Ajuda

Processo de instalação

Para usar o GPT-Image-Edit, primeiro você precisa clonar o projeto e configurar o ambiente de desenvolvimento. Veja a seguir as etapas detalhadas de instalação:

armazém de clones
Clone o projeto localmente executando o seguinte comando em um terminal ou linha de comando:
```
git clone https://github.com/wyhlovecpp/GPT-Image-Edit.git
cd GPT-Image-Edit
```
Instalação de dependências
O projeto depende do ambiente Python e de algumas bibliotecas de terceiros. Certifique-se de que você tenha o Python 3.7 ou superior instalado. Em seguida, execute-o:
```
pip install -r requirements.txt
```
Esse comando instala as bibliotecas necessárias, como openaiepillow etc. Se você encontrar problemas de dependência, poderá verificar o requirements.txt para garantir que todas as versões da biblioteca sejam compatíveis.
Configuração de chaves de API
O GPT-Image-Edit usa a API da OpenAI e requer uma chave de API para ser configurado. Os usuários precisam se registrar na plataforma OpenAI e obter a chave. Adicione a chave a uma variável de ambiente ou a um arquivo de configuração:
- Criar um .env arquivo, escrever:
```
OPENAI_API_KEY=your_openai_api_key_here
```
- Ou defina-o diretamente no código:
```
client = OpenAI(api_key="your_openai_api_key_here")
```
Projetos em andamento
Após concluir a configuração, execute o arquivo do programa principal (por exemplo main.py):
```
python main.py
```
O projeto iniciará uma interface local simples; a operação exata pode mudar devido a atualizações de código; recomenda-se consultar o README.md Documentação.

Funções principais

1. geração de imagens

Os usuários podem gerar imagens completamente novas a partir de descrições de texto. Por exemplo, se você quiser gerar uma imagem de um "castelo à noite sob as estrelas", basta digitar:

prompt = "A castle under a starry night sky, in a fantasy style"
result = client.images.generate(model="gpt-image-1", prompt=prompt, size="1024x1024")

A imagem gerada é retornada na codificação base64 e o código é salvo automaticamente como um arquivo local (por exemplo output.png). O usuário pode ajustar o size parâmetros (por exemplo 512x512 talvez 1024x1536) resolução de controle.

2. edição de imagens existentes

Os usuários podem carregar uma imagem e modificá-la com comandos de texto. Por exemplo, para adicionar um chapéu a uma foto de um gato:

Carregamento de imagens: Coloque um arquivo de imagem (por exemplo cat.png) na pasta especificada pelo projeto (geralmente imgs/).

Digite o comando edit:

img_input = open("imgs/cat.png", "rb")
prompt_edit = "Add a red hat on the cat, in a cartoon style"
result_edit = client.images.edit(model="gpt-image-1", image=img_input, prompt=prompt_edit)

Salvar resultado: A imagem editada será salva no caminho especificado (por exemplo imgs/edited_cat.png).

3. edição usando máscaras

A função Mask (Máscara) permite que o usuário especifique uma área específica da imagem a ser editada, protegendo o restante de modificações. Etapas da operação:

Prepare a imagem da máscara: use um software de edição de imagens (por exemplo, Photoshop) para criar uma máscara em preto e branco, com a parte preta indicando a área a ser editada e a parte branca permanecendo inalterada. Certifique-se de que a máscara contenha um canal alfa.

Exemplo de código:

img_input = open("imgs/cat.png", "rb")
mask_input = open("imgs/mask.png", "rb")
prompt_mask = "Change the background to a forest scene"
result_mask = client.images.edit(model="gpt-image-1", image=img_input, mask=mask_input, prompt=prompt_mask)

Observação: A edição da máscara pode não ser precisa o suficiente e o modelo às vezes afeta o conteúdo dentro da área da máscara. Os usuários são aconselhados a testar e otimizar as palavras-chave.

4. mudanças de estilo

O usuário pode alterar o estilo da imagem usando a palavra-chave. Por exemplo, transformar uma foto em um estilo de pintura a óleo:

prompt_style = "Convert this image to an oil painting style"
result_style = client.images.edit(model="gpt-image-1", image=open("imgs/photo.png", "rb"), prompt=prompt_style)

A imagem resultante mantém o conteúdo original, mas apresenta o estilo artístico especificado.

Dicas e truques

Otimização de palavras-chaveGeração de imagens: Quanto mais específica for a sugestão, melhor será a geração. Por exemplo, "um gato preto sentado em uma mesa de madeira usando um chapéu vermelho com um pôr do sol ao fundo" funciona melhor do que "um gato usando um chapéu".
arquivo de loteO projeto suporta o processamento de várias imagens ao mesmo tempo e é adequado para usuários que precisam editar um grande número de imagens rapidamente.
Depuração e registro em logVerifique a saída do console em tempo de execução para ter certeza de que a chamada à API foi bem-sucedida. Se for encontrado um erro, verifique a chave da API ou a conexão de rede.

advertência

O projeto requer uma conexão de rede estável para chamar a API do OpenAI.
Certifique-se de que sua conta da OpenAI esteja verificada, caso contrário, ela poderá não funcionar! gpt-image-1 Modelos.
O código do projeto está sujeito a alterações devido a atualizações, e é recomendável verificar regularmente o repositório do GitHub para obter os últimos commits.

cenário do aplicativo

criação de conteúdo
Os designers podem usar o GPT-Image-Edit para gerar ou modificar rapidamente materiais de imagem. Por exemplo, crie pôsteres de mídia social ou ajuste o plano de fundo das imagens de produtos.
Educação e pesquisa
Estudantes e pesquisadores podem usá-lo para explorar técnicas de geração de imagens de IA, testar os efeitos de diferentes palavras-chave ou integrar recursos de processamento de imagens em projetos acadêmicos.
desenvolvimento de jogos
Os desenvolvedores de jogos podem gerar rapidamente arte conceitual ou editar imagens de personagens, ajustando o estilo para se adequar ao tema do jogo.
Fluxos de trabalho automatizados
Os usuários corporativos podem integrar a ferramenta em fluxos de trabalho automatizados para processar imagens de produtos em lote ou gerar materiais de marketing personalizados.

QA

Preciso pagar para usá-lo?
O GPT-Image-Edit em si é gratuito e de código aberto, mas requer uma chave de API da OpenAI, e o uso da API incorrerá em uma taxa, dependendo das taxas de faturamento da OpenAI.
Quais formatos de imagem são suportados?
Os formatos comuns, como PNG e JPEG, são compatíveis. Os arquivos de máscara precisam conter um canal alfa e geralmente são salvos no formato PNG.
Como melhorar a qualidade das imagens geradas?
Especificar estilos, cores e cenas usando palavras-chave detalhadas. Ajuste os parâmetros de resolução (como 1024x1024) pode melhorar a nitidez da imagem.
Ele pode ser usado off-line?
Não há suporte para o uso off-line, e a geração e a edição de imagens dependem da API de nuvem da OpenAI.

GPT-Image-Edit: ferramenta para editar e gerar imagens usando comandos de texto

Lista de funções

Usando a Ajuda

Processo de instalação

Funções principais

1. geração de imagens

2. edição de imagens existentes

3. edição usando máscaras

4. mudanças de estilo

Dicas e truques

advertência

cenário do aplicativo

QA

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

GPT-Image-Edit: ferramenta para editar e gerar imagens usando comandos de texto

Lista de funções

Usando a Ajuda

Processo de instalação

Funções principais

1. geração de imagens

2. edição de imagens existentes

3. edição usando máscaras

4. mudanças de estilo

Dicas e truques

advertência

cenário do aplicativo

QA

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida