Fatores técnicos que afetam a precisão analítica
Os dados de teste mostram que, quando a resolução da foto de entrada é inferior a 800×600 pixels, a precisão do reconhecimento da API do Google Vision cai do valor de referência de 92% para 76%; a taxa de erro de reconhecimento das emoções das pessoas em fotos desfocadas ou com luz de fundo chega a 43%. Já a precisão do reconhecimento de objetos de imagens de alta definição capturadas por DSLRs profissionais pode chegar a 96% e pode extrair parâmetros de metadados mais ricos. É importante observar que o processamento comum de filtros de mídia social interfere no julgamento da IA - fotos com filtros de "nostalgia" adicionados no teste tiveram um aumento de 28% na taxa de erro de reconhecimento de cena.
Os desenvolvedores da ferramenta recomendam que os usuários carreguem fotos de qualidade original para teste e também oferecem três opções de pré-processamento: orientação automática, redução inteligente de ruído e limpeza de EXIF. Os experimentos de comparação mostram que as fotos pré-processadas e de baixa qualidade podem ser analisadas com 19 pontos percentuais a mais de confiança. No entanto, o sistema ainda não é capaz de resolver áreas de imagens muito mosaicadas ou cortadas, o que é uma limitação geral da tecnologia de visão computacional.
Essa resposta foi extraída do artigoEles veem suas fotos: analisando informações de privacidade de fotos com base no Google VisionO































