Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

HumanOmni ist das erste multimodale Open-Source-Modell der Branche, das sich auf die Analyse menschlicher Videos konzentriert

2025-08-28 1.6 K

HumanOmni's Branchenführerschaft

HumanOmni, das vom HumanMLLM-Team entwickelt und auf GitHub veröffentlicht wurde, ist derzeit das erste multimodale Makromodell der Branche, dessen Kernaufgabe die menschliche Videoanalyse ist. Das Modell integriert innovativ 2,4 Millionen menschenzentrierte Videoclips und 14 Millionen Anweisungsdaten für das Vortraining und verwendet 50.000 fein gelabelte Videoclips für die Feinabstimmung.

Ihre Grundwerte spiegeln sich in drei Bereichen wider:

  • Vollständige Dimensionen der AnalyseGleichzeitige Erfassung von Gesichtsausdruck, Körperbewegung und interaktiver Szenenerkennung
  • Dynamische IntegrationsmechanismenDie Gewichte der drei Analysezweige können automatisch entsprechend den Eingaben angepasst werden.
  • Open-Source-EigenschaftenVollständige Verfügbarkeit von Code, vortrainierten Modellen und partiellen Datensätzen

Im Vergleich zu traditionellen unimodalen Modellen erreicht HumanOmni einen UAR von 74,861 TP3T auf dem DFEW-Emotionserkennungsdatensatz und liegt damit deutlich vor den 50,571 TP3T von GPT4-O. Diese bahnbrechende Leistung bestätigt seine technologische Überlegenheit als Domain-First-Modell.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang