Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Wie lässt sich die Genauigkeit der szenenübergreifenden Blickvorhersage verbessern?

2025-09-10 2.1 K

Drei Möglichkeiten zur Verbesserung der szenarioübergreifenden Vorhersagegenauigkeit

Gaze-LLE hat bereits eine gute Generalisierungsfähigkeit durch Pre-Training-Strategien und Modellauswahl, und für eine weitere Verbesserung der szenenübergreifenden Genauigkeit kann es sein:

  1. Modellauswahl:Prioritäten setzen_inoutSuffix-Modelle (z. B. gazelle_dinov2_vitb14_inout), die GazeFollow + VideoAttentionTarget Co-Trainingsdaten verwenden, um ein breites Spektrum von Innen- und Außenszenen abzudecken
  2. Transfer-Lernen:Auftauen der letzten 3 Schichten des Backbone für die Feinabstimmung, Trainieren von 5-10 Epochen auf einer kleinen Datenprobe (~200 beschriftete Karten) aus der neuen Szene
  3. Nachbearbeitungsoptimierung:Führen Sie die Nicht-Maximum-Unterdrückung (NMS) auf der Ausgabe-Heatmap durch und legen Sie einen Schwellenwert fest, um Vorhersagepunkte mit einer Konfidenz <0,7 herauszufiltern.

Hinweis: Der Merkmalsextraktor von DINOv2 hat bereits während des Pre-Trainings eine Vielzahl von Szenenmerkmalen erfasst, und es wird im Allgemeinen nicht empfohlen, ihn komplett neu zu trainieren. Wenn die Zielszene besondere Lichtverhältnisse aufweist (z. B. Infrarot-Überwachung), wird empfohlen, in der Vorverarbeitungsphase der Daten eine Histogramm-Entzerrung durchzuführen.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang