マイクロソフトのウィンドウ認識精度を向上させる方法
Omni-Bot-SDK-OSSは、WeChatのウィンドウ認識とメッセージ解析にYOLOモデルとOCR技術を使用しています。認識精度が不十分な場合は、以下のステップで最適化することができます:
- マイクロソフト・ウィンドウの可視性を確保するWeChat クライアントを最前面に配置し、ウィンドウの重なりや最小化を避け、解像度を 1920 x 1080 以上にしてください。
- モデル・パラメーターの調整で
config.yamlでYOLOモデルの信頼しきい値(0.7~0.9を推奨)とOCRの認識領域パラメータを変更する。 - ユニークな識別子の使用グループチャットや同姓同名のコンタクトの干渉を避けるため、コンタクトにノート名を追加し、メッセージ送信時にニックネームの代わりにノート名を指定します。
- スタンドアロン機器展開他のプロセスがマウス/キーボードのリソースを占有するのを避けるため、フレームワークを専用デバイス上で実行します。
それでも問題が解決しない場合は、次のようなプログレッション・プログラムが用意されている:
- カスタマイズされた認識テンプレートを生成するために、視覚化クライアントでマイクロソフトのウィンドウ要素に手動でラベルを付ける
- 自己学習YOLOモデル(WeChatインターフェイスのスクリーンショットデータセットを準備する必要がある)
- 二値化しきい値、テキスト領域の切り抜き比率などのOCR前処理パラメータを調整します。
この答えは記事から得たものである。Omni-Bot-SDK-OSS: WeChat RPAのための視覚認識ベースの自動化フレームワークについて































