Das FLUX.1-Kontext-dev-Modell, das von 4o-ghibli-at-home verwendet wird, stellt einen aktuellen technologischen Durchbruch auf dem Gebiet der Bildstilkonvertierung dar. Das Modell wendet auf intelligente Weise Ghibli-Stilmerkmale durch einen dynamischen, kontextabhängigen Mechanismus an, während die strukturelle Integrität des Originalbildes erhalten bleibt. Die Testdaten des Projekts zeigen:
- Bei Eingaben mit einer Auflösung von 512 x 512 ist das Modell in der Lage, die Rekonstruktion des Stils zu vervollständigen und dabei 99% Schlüsselmerkmale (z. B. Gesichtskonturen, Gebäudelinien) zu erhalten.
- 3-5 mal schnellere Verarbeitungsgeschwindigkeit im Vergleich zu herkömmlichen neuronalen Stilübertragungsalgorithmen
- Der VRAM-Bedarf wird unter 4 GB gehalten, so dass Grafikkarten der GTX 1660-Klasse reibungslos arbeiten können.
Die Leistung wird durch den Einsatz der DFloat11-Quantisierungstechnologie weiter optimiert. Diese Technologie komprimiert das Modellvolumen auf das ursprüngliche 60% ohne Qualitätsverlust, indem sie mit 11-Bit-Fließkomma-Präzision rechnet. Der vom Benutzer einstellbare Detail-Parameter (Stufe 1-10) in der .env-Konfigurationsdatei steuert die Zuweisung der Aufmerksamkeitsgewichtung für die Verbindungen zwischen den Schichten des Modells, die von professionellen Anwendern fein abgestimmt werden kann, um eine individuelle Gestaltung zu ermöglichen.
Diese Antwort stammt aus dem Artikel4o-ghibli-at-home: lokal laufendes Bildkonvertierungsprogramm im Ghibli-Stil》































