Generierung kreativer Inhalte auf der Grundlage von Referenzbildern
Die Graphen-zu-Graphen-Funktionalität von CloudFlare-AI-Image basiert auf der kollaborativen Arbeit von hochgeladenen Bildern und textlichen Hinweisen. Das System extrahiert zunächst die Merkmalsvektoren des Referenzbildes durch einen visuellen Kodierer und kombiniert sie dann mit textlichen Hinweisen für die Reorganisation des Inhalts im latenten Raum.
Typische Anwendungsszenarien sind:
- Stilkonvertierung: Konvertieren von Fotos in den Stil von Cartoons oder Ölgemälden
- Inhaltliche Erweiterung: Generierung vollständiger Szenen auf der Grundlage von Teilskizzen
- Qualitätsverbesserung: Verbesserte Details in Bildern mit niedriger Auflösung
Die technische Implementierung unterstützt die Übertragung von Base64-kodierten Bilddaten, und der Grad der Umschreibung kann durch Angabe des Intensitätsparameters beim Aufruf über die API gesteuert werden. Das Hochladen von Gebäudefotos mit der Aufforderung "futuristische Stadt" kann beispielsweise Bilder von Gebäuden mit Science-Fiction-Effekt erzeugen. In der Praxis empfiehlt es sich, die thematische Konsistenz zwischen dem Referenzbild und dem Stichwort zu wahren, und das System reagiert vorrangig auf Textbefehle, wenn ein Konflikt zwischen den beiden besteht.
Diese Funktion eignet sich besonders für Designer, die schnell kreative Lösungen erstellen möchten. Tests ergaben eine durchschnittliche Zeit vom Hochladen bis zur Erstellung von 12 Sekunden (basierend auf dem Modell SD-XL).
Diese Antwort stammt aus dem ArtikelCloudflare Worker-basierte AI-BilderzeugungsskripteDie































