Técnicas de caracterização de probabilidade espacial
O Gaze-LLE gera um mapa de calor espacial normalizado para o intervalo [0,1], com cada valor de pixel correspondendo à densidade de probabilidade do olhar. Essa representação é mais interpretativa do que a regressão de coordenadas tradicional, refletindo tanto a região de foco do olhar quanto o nível de incerteza. Para a implementação técnica, o modelo usa um decodificador leve para converter os recursos visuais extraídos pelo DINOv2 em um mapa de distribuição de probabilidade com uma resolução de 256 × 256.
O formato de saída é particularmente adequado para a análise de cenas com vários jogadores, em que uma única propagação direta pode ser usada para gerar um mapa de calor do olhar de todos os indivíduos na cena. No design da interface do usuário, as regiões de olhar podem ser geradas por filtragem de limiar probabilístico ou o mapa original pode ser sobreposto para análise visual. Os experimentos mostram que o método atinge uma métrica AUC de 92,31 TP3T no conjunto de dados GazeFollow.
Essa resposta foi extraída do artigoGaze-LLE: ferramenta de previsão de alvos para o olhar de pessoas em vídeosO































