Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Welche vortrainierten Modelle unterstützt Gaze-LLE? Wie wähle ich das richtige Modell aus?

2025-09-10 2.1 K

Gaze-LLE bietet derzeit die folgenden vier Standard-Vorschulungsmodelle an:

Basic Modelling Group:

  • gazelle_dinov2_vitb14Basierend auf der DINOv2 ViT-B Architektur, trainiert auf dem GazeFollow-Datensatz
  • gazelle_dinov2_vitl14Basierend auf der DINOv2 ViT-L Architektur, trainiert auf dem GazeFollow-Datensatz

Verbesserte Modellsätze:

  • gazelle_dinov2_vitb14_inoutViT-B Architektur, gemeinsames GazeFollow + VideoAttentionTarget Training
  • gazelle_large_vitl14_inoutViT-L Architektur, gemeinsames GazeFollow + VideoAttentionTarget Training

Empfehlungen für die Auswahl:

  1. Bevorzugung des ViT-B-Basismodells für Szenarien mit begrenzten Rechenressourcen
  2. ViT-L Architektur für höchste Präzision.
  3. Wenn das Anwendungsszenario Innen- und Außenbereiche umfasst, wird empfohlen, die erweiterte Datensatzversion _inout zu verwenden
  4. Die Vorhersageeffekte der verschiedenen Modelle können mit dem Colab-Beispiel verglichen werden

Alle Modelle sind so optimiert, dass sie direkt über PyTorch Hub geladen und verwendet werden können, was eine Plug-and-Play-Blickvorhersage ohne zusätzliches Training ermöglicht.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang