Intelligente Technologie zur Texteinbettung
Das Text-Overlay-System von Kozy durchbricht die Beschränkungen herkömmlicher Untertitelungstools, bei denen die Benutzer nur Befehle in natürlicher Sprache eingeben müssen, wie z. B. "Untertitel für den Namen des Haustiers hinzufügen", und die KI den gesamten Prozess von der Erkennung bis zum Satz übernimmt. Die technische Umsetzung umfasst drei innovative Ebenen:
- Semantische Parsing-Schicht:Genaue Extraktion von Textelementen in Anweisungen (z. B. Subjekt-Objekt, Textart, Zeitspanne des Auftretens)
- Visuelle Analyseschicht:Automatische Erkennung von Bereichen im Video, die sich für die Überlagerung von Text eignen, um zu vermeiden, dass wichtige Inhalte verdeckt werden
- Dynamische Anpassungsschicht:Passt die Textfarbe automatisch an den Videoton an, um die Lesbarkeit zu gewährleisten
Tests haben gezeigt, dass die von Kozy generierten Textüberlagerungen eine durchschnittliche Erkennungsrate von 921 TP3T erreichten, viel höher als die 781 TP3T von manuell hinzugefügten Untertiteln. Das System eignet sich besonders für kommerzielle Videoszenen, die eine schnelle Hinzufügung von Produktbeschreibungen und Titelausschnitten erfordern, und verkürzt den Untertitelungsprozess, der sonst 20 Minuten dauern würde, auf 3 Sekunden.
Diese Antwort stammt aus dem ArtikelKozy: ein Online-Tool zur schnellen Bearbeitung kurzer Videos mit TextbeschreibungenDie































