Wege zur Verbesserung der Genauigkeit der Microsoft-Fenstererkennung
Omni-Bot-SDK-OSS basiert auf dem YOLO-Modell und der OCR-Technologie für die Erkennung von WeChat-Fenstern und das Parsen von Nachrichten. Wenn die Erkennungsgenauigkeit unzureichend ist, können die folgenden Schritte unternommen werden, um sie zu optimieren:
- Sicherstellung der Sichtbarkeit von microsoft windowPlatzieren Sie den WeChat-Client im Vordergrund, vermeiden Sie überlappende oder minimierte Fenster und halten Sie eine Auflösung von 1920 x 1080 oder höher ein.
- Anpassung der Modellparameter: in
config.yamlÄndern Sie die Konfidenzschwelle des YOLO-Modells (0,7-0,9 wird empfohlen) und den Parameter für den Erkennungsbereich der OCR in der - Verwendung von eindeutigen ErkennungsmerkmalenHinzufügen von Notiznamen zu Kontakten, um zu verhindern, dass Gruppenchats/Kontakte mit demselben Namen in Konflikt geraten, und Angabe von Notiznamen anstelle von Spitznamen beim Senden von Nachrichten.
- Einsatz von Stand-alone-Geräten: Führen Sie das Framework auf einem dedizierten Gerät aus, um zu vermeiden, dass andere Prozesse Maus-/Tastaturressourcen beanspruchen.
Bleibt das Problem bestehen, steht das folgende Fortschrittsprogramm zur Verfügung:
- Manuelle Beschriftung von Microsoft-Fensterelementen im Visualisierungsclient zur Generierung individueller Erkennungsvorlagen
- Selbsttraining des YOLO-Modells (Vorbereitung des Screenshot-Datensatzes der WeChat-Oberfläche erforderlich)
- Passen Sie die Parameter für die OCR-Vorverarbeitung an, z. B. Binarisierungsschwelle, Beschneidungsverhältnis des Textbereichs usw.
Diese Antwort stammt aus dem ArtikelOmni-Bot-SDK-OSS: Ein auf visueller Erkennung basierender Automatisierungsrahmen für WeChat RPADie































