空间概率表征技术
Gaze-LLE输出的是标准化至[0,1]区间的空间热图,每个像素值对应注视概率密度。这种表征方式比传统的坐标回归更具解释性,能够同时反映注视焦点区域和不确定性程度。技术实现上,模型采用轻量级解码器将DINOv2提取的视觉特征转换为256×256分辨率的概率分布图。
该输出格式特别适合多人场景分析,通过单次前向传播即可生成场景中所有个体的注视热图。在用户界面设计中,可通过概率阈值过滤生成注视区域,或叠加原图实现可视化分析。实验显示该方法在GazeFollow数据集上达到92.3%的AUC指标。
Essa resposta foi extraída do artigoGaze-LLE: ferramenta de previsão de alvos para o olhar de pessoas em vídeosO