Fähigkeit zur Erzeugung von Mehrrollen-Konsistenz
1Prompt1Story zeichnet sich durch die Erzeugung mehrerer Zeichen aus. Während herkömmliche Text-zu-Bild-Modelle bei mehreren Zeichen zur Identitätsverwechslung neigen, stellt das Tool durch ein innovatives Design des Aufmerksamkeitsmechanismus sicher, dass jedes Zeichen seine eigene einzigartige Identität beibehält.
Zu den spezifischen Realisierungstechniken gehören:
- Hierarchische Aufmerksamkeitszuweisung: unabhängige Verarbeitung von Merkmalsvektoren für verschiedene Rollen
- Merkmalsübergreifende Fusion: Ermöglichung natürlicher Interaktionen zwischen Zeichen auf einer hohen semantischen Ebene
- Kontrastive Merkmalsverstärkung: Verstärkung der Differenzierung zwischen den Rollen
Praktische Tests zeigen, dass das System bei 200 Cue-Sets aus 8 Superklassen im Consistory+ Benchmark-Test durchgängig Multi-Rollen-Bilder mit klarer Identitätsdifferenzierung ausgibt.
Diese Antwort stammt aus dem ArtikelOne-Prompt-One-Story: Textprompts erzeugen konsistente Bilder zur CharakteridentitätDie































