海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

Gaze-LLE支持哪些预训练模型?如何选择合适的模型?

2025-09-10 1.9 K

Gaze-LLE目前提供以下四种标准预训练模型:

基础模型组:

  • gazelle_dinov2_vitb14:基于DINOv2 ViT-B架构,在GazeFollow数据集训练
  • gazelle_dinov2_vitl14:基于DINOv2 ViT-L架构,在GazeFollow数据集训练

增强模型组:

  • gazelle_dinov2_vitb14_inout:ViT-B架构,联合GazeFollow+VideoAttentionTarget训练
  • gazelle_large_vitl14_inout:ViT-L架构,联合GazeFollow+VideoAttentionTarget训练

选择建议:

  1. 对计算资源有限的场景优先选择ViT-B基础模型
  2. 需要最高精度时选用ViT-L架构
  3. 当应用场景包含室内外环境时推荐使用_inout扩展数据集版本
  4. 可通过Colab示例比较不同模型的预测效果

所有模型都经过优化,可以直接通过PyTorch Hub加载使用,无需额外训练即可实现即插即用的注视预测。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文