Maneiras de resolver a precisão do reconhecimento de janelas da Microsoft
O Omni-Bot-SDK-OSS conta com o modelo YOLO e a tecnologia OCR para reconhecimento de janelas do WeChat e análise de mensagens. Se a precisão do reconhecimento for insuficiente, as seguintes etapas podem ser adotadas para otimizá-la:
- Garantir a visibilidade do Microsoft WindowsColoque o cliente WeChat em primeiro plano, evite janelas sobrepostas ou minimizadas e mantenha uma resolução de 1920 x 1080 ou superior.
- Ajuste dos parâmetros do modelo: em
config.yamlModifique o limite de confiança do modelo YOLO (recomenda-se 0,7 a 0,9) e o parâmetro da região de reconhecimento do OCR no - Uso de identificadores exclusivosNota: Adicione nomes de notas aos contatos para evitar interferência de bate-papo em grupo/contatos com o mesmo nome e especifique nomes de notas em vez de apelidos ao enviar mensagens.
- Implantação de equipamentos autônomosExecute a estrutura em um dispositivo dedicado para evitar que outros processos ocupem os recursos do mouse/teclado.
Se o problema persistir, o seguinte programa de progressão está disponível:
- Rotulagem manual de elementos do Microsoft Windows no cliente de visualização para gerar modelos de reconhecimento personalizados
- Modelo YOLO de autotreinamento (é necessário preparar o conjunto de dados de captura de tela da interface do WeChat)
- Ajuste os parâmetros de pré-processamento de OCR, como limiar de binarização, taxa de corte da área de texto, etc.
Essa resposta foi extraída do artigoOmni-Bot-SDK-OSS: uma estrutura de automação baseada em reconhecimento visual para WeChat RPAO































