Esquema de operação de precisão baseado no módulo de percepção visual do MobileAgent
O MobileAgent resolve o problema da baixa precisão de reconhecimento da interface do usuário das ferramentas de automação tradicionais por meio de um módulo de percepção visual aprimorado.
Realização da tecnologia principal:
- Posicionamento dinâmico de elementosAlgoritmo de reconhecimento multimodal (texto + ícone + posição), a taxa de sucesso aumentou para 95%
- Mecanismo de tratamento de exceções3 novas tentativas acionadas automaticamente quando a operação atinge o tempo limite ou o elemento não é encontrado + análise de captura de tela
- sensível ao contextoMonitoramento da pilha de atividades: garanta que o fluxo de operações esteja em conformidade com o estado esperado por meio do monitoramento da pilha de atividades
Práticas recomendadas:
- Defina o parâmetro visual_timeout no arquivo de configuração como 2000-3000ms (é necessário fazer um ajuste fino para dispositivos diferentes)
- Para cenários de operação de alta frequência, é recomendável registrar previamente o caminho da operação e salvá-lo como um modelo.
- A ativação da versão v3 da função de memória reduz as identificações duplicadas não essenciais do 15%
Deve-se observar que a limpeza regular do cache do sistema e a consistência dos elementos da interface podem melhorar ainda mais a estabilidade.
Essa resposta foi extraída do artigoMobileAgent: colaboração multiagente para assistente de operação de dispositivos móveisO































