Acesso no exterior: www.kdjingpai.com

Ctrl + D Marcar este site como favorito

Posição atual:fig. início " Respostas da IA

什么是Gaze-LLE，它的主要功能是什么？

2025-09-10

Respostas da IA

1.9 K

Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具，由Fiona Ryan、Ajay Bati等研究人员开发。该工具的核心目标是通过预训练的视觉基础模型（如DINOv2）高效预测视频或图像中人物的注视目标。

Suas principais funções incluem:

Foco na previsão de metas：利用预训练的视觉编码器准确预测注视位置
Previsão de múltiplos olhares：可同时处理单张图像中的多个人物
Arquitetura leve：仅需在冻结的预训练编码器上学习轻量级解码器
Suporte a vários modelos：提供基于不同骨干网络（ViT-B/ViT-L）和训练数据的预训练模型

与同类工具相比，Gaze-LLE的突出优势是参数规模减小了1-2个数量级，且不需要额外的输入模态（如深度或姿态信息）。

Essa resposta foi extraída do artigoGaze-LLE: ferramenta de previsão de alvos para o olhar de pessoas em vídeosO

Artigos relacionados

Não pode ser reproduzido sem permissão:Ferramentas de produtividade de IA " 什么是Gaze-LLE，它的主要功能是什么？

Recomendado

Português do Brasil