当前位置：首页 » AI答疑

什么是Gaze-LLE，它的主要功能是什么？

2025-09-10

2.0 K

Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具，由Fiona Ryan、Ajay Bati等研究人员开发。该工具的核心目标是通过预训练的视觉基础模型（如DINOv2）高效预测视频或图像中人物的注视目标。

其主要功能包括：

与同类工具相比，Gaze-LLE的突出优势是参数规模减小了1-2个数量级，且不需要额外的输入模态（如深度或姿态信息）。

快速查询站内AI工具