O 4o-ghibli-at-home é uma ferramenta de conversão de estilo de imagem de IA de código aberto focada na conversão de imagens carregadas pelo usuário em obras de arte no estilo do Studio Ghibli. Ela usa os modelos FLUX.1-Kontext-dev e DFloat11 e é executada em dispositivos locais para garantir a privacidade dos dados. Os usuários não precisam fazer login nem depender de serviços em nuvem, pois todo o processamento de imagens é feito localmente. A ferramenta é adequada para criadores que gostam do estilo Ghibli ou fãs de anime, e pode transformar rapidamente fotos comuns em imagens artísticas com cores suaves e texturas pintadas à mão. O projeto está licenciado sob a licença AGPLv3, que permite o uso gratuito para fins pessoais e de pesquisa.
Lista de funções
- Converta imagens comuns em imagens artísticas no estilo Studio Ghibli, com suporte a estilos de anime, arte ou personalizados.
- Oferece processamento eficiente de imagens usando os modelos FLUX.1-Kontext-dev e DFloat11.
- Oferece suporte à operação local, protege a privacidade do usuário e os dados da imagem não são carregados na nuvem.
- Oferece uma interface de linha de comando fácil de usar para usuários técnicos.
- Suporta a execução em sistemas Linux e é compatível com dispositivos móveis e de desktop.
- Permite que o usuário ajuste os parâmetros de processamento de imagem por meio de perfis para atender às necessidades individuais.
- Projeto de código aberto, o código é aberto, permitindo que os usuários o modifiquem e otimizem.
Usando a Ajuda
Processo de instalação
Para usar o 4o-ghibli-at-home, os usuários precisam concluir a instalação em um sistema Linux. Abaixo estão as etapas detalhadas:
- Clonagem do código do projeto
Abra um terminal e digite o seguinte comando para clonar o projeto localmente:git clone https://github.com/TheAhmadOsman/4o-ghibli-at-home.git cd 4o-ghibli-at-home
- Criação de um ambiente virtual
Recomendado para projetosuv
para gerenciar o ambiente virtual do Python. Se ouv
Instale-o primeiro:curl -LsSf https://astral.sh/uv/install.sh | sh
Após a instalação, pode ser necessário reiniciar o terminal para garantir que o
uv
entra em vigor. Em seguida, crie o ambiente virtual:uv venv .venv --python 3.12 source .venv/bin/activate
- Instalação de dependências
Sincronize as dependências do Python exigidas pelo projeto em um ambiente virtual:uv sync
- Configuração de variáveis de ambiente
O projeto precisa do token de acesso do Hugging Face para fazer o download do modelo. Copie o arquivo de modelo e configure-o:cp .env_template .env
Abrir com um editor de texto
.env
preencha o token de acesso do Hugging Face (gerado nas configurações da conta do Hugging Face). Exemplo:HUGGING_FACE_HUB_TOKEN=your_token_here
Se tiver sido aprovada
huggingface-cli login
não há necessidade de configurar um token manualmente. - Início dos serviços
Quando a configuração estiver concluída, inicie o serviço do projeto:python3.12 app.py
Quando o serviço é iniciado, o projeto executa um servidor da Web local e processos de processamento em segundo plano para conversão de estilo de imagem.
Uso
Depois de iniciar o serviço, os usuários podem fazer upload de imagens por meio da linha de comando ou da interface da Web. As operações específicas são as seguintes:
- Preparação da imagem
Verifique se há arquivos de imagem (como o formato JPG ou PNG) que precisam ser convertidos em estilo. Imagens de alta definição são recomendadas para obter melhores resultados. - Fazer upload de imagens
Quando o projeto estiver em execução, o acesso à interface da Web local (geralmente ohttp://localhost:5000
(A porta específica está sujeita ao prompt na inicialização). Selecione o arquivo de imagem na interface e clique em Upload. - Escolha um estilo
A interface oferece estilo Ghibli, estilo Anime ou outras opções de estilo personalizado. Os usuários podem escolher de acordo com suas necessidades. O estilo Ghibli recomendado por padrão imita o efeito suave de desenho à mão de Totoro ou The Thousand and One. - Parâmetros de ajuste
existir.env
ou na interface da Web, o usuário pode ajustar os parâmetros de processamento de imagens, como resolução, saturação de cores ou nível de detalhes. As configurações padrão podem ser mantidas para uso inicial. - Geração de imagens
Depois de carregar a imagem e selecionar um estilo, clique no botão "Generate" (Gerar). O tempo de processamento depende do desempenho do dispositivo e do tamanho da imagem, e geralmente leva de alguns segundos a alguns minutos. O resultado é exibido na interface e o usuário pode fazer download da imagem convertida.
Operação da função em destaque
- Câmbio estilo GhibliA função principal é transformar fotos em imagens no estilo Ghibli. Depois que os usuários fazem upload de fotos de paisagens ou pessoas, a ferramenta aplica automaticamente cores suaves, texturas sutis e fundos inspirados em animes para produzir imagens que lembram os filmes do Studio Ghibli.
- PrivacidadeProcessamento: Todo o processamento é feito localmente e as imagens não são carregadas na nuvem, o que o torna adequado para usuários sensíveis à privacidade dos dados.
- Estilos personalizadosOs usuários podem estender o suporte a outros estilos de arte, como mangá ou aquarela, modificando os arquivos de configuração ou o código.
- Processamento eficienteO modelo FLUX.1 é otimizado para uso de VRAM e é adequado para execução em dispositivos de baixo a médio porte com velocidades de geração mais rápidas.
advertência
- Certifique-se de que o dispositivo tenha espaço de armazenamento suficiente (os arquivos do modelo são grandes e podem exigir vários GB).
- Na primeira vez em que for executado, será necessário fazer o download do modelo, o que pode levar muito tempo, portanto, é recomendável manter sua rede estável.
- Se você encontrar uma falha no download do modelo, verifique se o token Hugging Face está correto.
- No momento, o projeto é compatível apenas com o Linux; os usuários do Windows terão que aguardar atualizações posteriores.
cenário do aplicativo
- Criação artística pessoal
Os entusiastas da animação podem converter fotos do cotidiano, como selfies ou paisagens, em obras de arte no estilo Ghibli para compartilhamento em mídias sociais ou coleções pessoais. - Produção de material de design
Ilustradores ou designers gráficos podem usar a ferramenta para gerar rapidamente imagens no estilo Ghibli para pôsteres, papéis de parede ou arte conceitual. - Educação e pesquisa
Os pesquisadores de IA podem usar o código-fonte aberto para estudar técnicas de transformação de estilo de imagem e explorar cenários em que o modelo FLUX.1 pode ser aplicado. - Projeto da comunidade de fãs
Os fãs do Studio Ghibli podem usar a ferramenta para gerar imagens para trabalhos homoeróticos, criar histórias em quadrinhos, papéis de parede ou designs periféricos.
QA
- Essa ferramenta é gratuita?
Sim, o 4o-ghibli-at-home é um projeto de código aberto sob a licença AGPLv3 e é gratuito para uso pessoal e de pesquisa. Se for usado para fins comerciais, ele precisa estar em conformidade com os requisitos da licença e divulgar o código-fonte modificado. - Precisa de um forte suporte de hardware?
Não é necessário um hardware de primeira linha, mas uma GPU com pelo menos 8 GB de RAM e 4 GB de memória de vídeo é recomendada para uma experiência tranquila. O modelo FLUX.1 foi otimizado para uso de VRAM e é adequado para dispositivos de baixo a médio porte. - Quais formatos de imagem são suportados?
Suporta formatos comuns, como JPG, PNG. Imagens de alta resolução são recomendadas para obter melhores resultados de conversão. - Como resolver a falha no download do modelo?
sonda.env
para o token Hugging Face correto, ou use o arquivohuggingface-cli login
Faça o login. Se a rede estiver instável, tente mudar de rede ou tente novamente mais tarde. - Você pode converter vídeos?
A versão atual suporta apenas a conversão de imagens estáticas. O suporte a vídeo poderá ser adicionado em uma atualização futura.