O modelo FLUX.1-Kontext-dev adotado pelo 4o-ghibli-at-home representa um avanço tecnológico atual no campo da conversão de estilo de imagem. O modelo aplica de forma inteligente os recursos do estilo Ghibli por meio de um mecanismo dinâmico sensível ao contexto, mantendo a integridade estrutural da imagem original. Os dados de teste do projeto mostram:
- Para entradas de resolução de 512 x 512, o modelo é capaz de concluir a reconstrução do estilo, mantendo os principais recursos do 99% (por exemplo, contornos de rosto, linhas de construção)
- Velocidade de processamento de 3 a 5 vezes mais rápida em comparação com os algoritmos tradicionais de transferência de estilo neural
- O espaço ocupado pela VRAM é mantido abaixo de 4 GB, permitindo que as placas de vídeo da classe GTX 1660 funcionem sem problemas.
O desempenho é otimizado ainda mais pela aplicação da tecnologia de quantização DFloat11. A tecnologia comprime o volume do modelo para o 60% original sem quase nenhuma perda de qualidade de saída, calculando com precisão de ponto flutuante de 11 bits. O parâmetro Detail ajustável pelo usuário (nível 1-10) no arquivo de configuração .env controla, na verdade, a alocação do peso da atenção para as conexões entre camadas do modelo, que podem ser ajustadas com precisão para a arte personalizada de usuários profissionais.
Essa resposta foi extraída do artigo4o-ghibli-at-home: ferramenta de conversão de imagens no estilo Ghibli executada localmente》































