Aufbau eines intelligenten Video-Klassifizierungssystems auf der Grundlage von Tarsier
Medienorganisationen stehen oft vor der Herausforderung, ihr Videomaterial zu überfrachten, was durch die Kombination von Tarsier erreicht werden kann:
- Mehrstufiges EtikettierungssystemDefinition von Klassifizierungskriterien (z. B. dreistufige Kennzeichnung von Szenen, Figuren, Handlungen) über den Parameter -instruction
- ÄhnlichkeitsclusterungAufbau eines Retrievalsystems mit der FAISS-Bibliothek unter Verwendung der von CLIP-ViT extrahierten Merkmalsvektoren
- Automatisierte ArbeitsabläufeSchreiben von Python-Skripten zur Automatisierung der Verarbeitung neu eingehender Videos und Ausgabe von Metadaten im CSV-Format
- Massenfiltration:: Automatisches Sperren von minderwertigem Material in Verbindung mit AutoDQ-Bewertungsergebnissen (empfohlener Schwellenwert 0,65).
Nach dem Einsatz eines TV-Senders konnte die Zeit für den Materialabruf von durchschnittlich 5 Minuten auf 30 Sekunden verkürzt werden, und die Genauigkeit der Erkennung von Duplikaten erreichte 92%.
Diese Antwort stammt aus dem ArtikelTarsier: ein quelloffenes Videoverstehensmodell zur Erstellung hochwertiger VideobeschreibungenDie































