海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

Gaze-LLEはどのような事前学習済みモデルをサポートしていますか?正しいモデルの選び方は?

2025-09-10 2.1 K

Gaze-LLEは現在、以下の4つの標準的な事前トレーニングモデルを提供しています:

ベーシック・モデリング・グループ:

  • gazelle_dinov2_vitb14GazeFollowデータセットで学習したDINOv2 ViT-Bアーキテクチャに基づく。
  • gazelle_dinov2_vitl14GazeFollowデータセットで学習したDINOv2 ViT-Lアーキテクチャに基づく。

モデルセットの充実:

  • gazelle_dinov2_vitb14_inoutViT-Bアーキテクチャ、GazeFollow+VideoAttentionTargetの共同トレーニング
  • gazelle_large_vitl14_inoutViT-Lアーキテクチャ、GazeFollow+VideoAttentionTargetの共同トレーニング

セレクションの推奨

  1. 計算資源が限られたシナリオではViT-Bベースモデルを優先
  2. 最高の精度を実現するViT-Lアーキテクチャ。
  3. アプリケーションシナリオに屋内と屋外の環境が含まれる場合は、_inout 拡張データセットバージョンを使用することをお勧めします。
  4. Colabの例は、異なるモデルの予測効果を比較するために使用できる。

すべてのモデルは、PyTorch Hub経由で直接ロードして使用できるように最適化されており、追加トレーニングなしでプラグアンドプレイで視線予測が可能です。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る