Die Soul ID-Technologie von Higgsfield AI hat einen Durchbruch bei der Erfassung dynamischer Merkmale von Charakteren durch ein neuronales Netzwerkmodell erzielt, das aus dem Training mit Fotos aus verschiedenen Winkeln erstellt wurde. Nachdem der Nutzer mehr als 10 Fotos mit unterschiedlichen Mikroausdrücken, Lichtverhältnissen und Blickwinkeln hochgeladen hat, kann das vom System erstellte 3D-Ausdrucksmodell mehr als 93% Gesichtsmuskelbewegungsmerkmale genau wiederherstellen. Die Testdaten zeigen, dass das erzeugte virtuelle Bild eine Genauigkeit von ±1,2 Grad bei der Krümmung des Mundwinkels erreicht und die Abweichung der Rotationsbahn des Augapfels weniger als 2,3 Pixel beträgt. Diese Parameter liegen nahe am Standard für die Erkennungsgenauigkeit von Face ID des iPhone 14 Pro.
Zu den Anwendungsszenarien für diese Technologie gehören:
- Echtzeit-Ansteuerung von 52 in Digital Split Live implementierten Basisausdrücken
- Ermöglicht Lippensynchronisationsfehler von weniger als 0,1 Sekunden bei der sprachübergreifenden Synchronisation von Videos
- Bewahrt die Konsistenz des Hautfarbenmaterials bei unterschiedlichen Lichtverhältnissen bis hin zu RGB ΔE<3
Bei einem A/B-Test im Jahr 2023 erhöhten die mit Soul ID erstellten Erklärvideos für den elektronischen Handel die Verweildauer der Nutzer um 171 TP3T gegenüber Live-Action-Videos.
Diese Antwort stammt aus dem ArtikelHiggsfield AI: Einsatz von KI zur Erstellung fotorealistischer Videos und personalisierter AvatareDie































