GLM-4.5Vは、GUI自動化テストにおける認識問題に対する専門的なソリューションを提供します:
- モデルの視覚的な要素位置(接地)機能を使用した正確な要素認識
- 座標[[x1,y1,x2,y2]]によって、従来の画像マッチングをはるかに上回る精度で、ターゲットコントロールを正確に特定します。
- コントロールIDに依存することなく、スクリーンショットに基づいたクリックやスワイプなどをサポート。
- 動的なUIでは、モデルはインターフェイスのロジックの関係を理解し、テストの安定性を向上させることができます。
- テストデータを保護するためにローカルに展開可能
このアプローチは、銀行やヘルスケアなどの業界におけるGUI自動化テストシナリオに特に適しており、誤検出率を大幅に低減することができる。
この答えは記事から得たものである。GLM-4.5V:画像や動画を理解しコードを生成できるマルチモーダル対話モデルについて































