GLM-4.5V bietet professionelle Lösungen für die Erkennungsprobleme im GUI-Automatisierungstest:
- Genaue Erkennung von Elementen mit Hilfe der visuellen Elementlokalisierung des Modells (Grounding)
- Präzise Lokalisierung von Zielkontrollen anhand von Koordinaten [[x1,y1,x2,y2]], mit einer Genauigkeit, die weit über der des herkömmlichen Bildabgleichs liegt.
- Unterstützt Klicken, Streichen usw. auf der Grundlage von Screenshots, ohne sich auf Kontroll-IDs zu verlassen.
- Für dynamische UI, kann das Modell der Schnittstelle Logik Beziehung zu verstehen, verbessern Teststabilität
- Lokale Bereitstellung zur Sicherung von Testdaten
Dieser Ansatz eignet sich besonders für GUI-Automatisierungstestszenarien in Branchen wie dem Bankwesen und dem Gesundheitswesen und kann die Rate der Fehlalarme erheblich reduzieren.
Diese Antwort stammt aus dem ArtikelGLM-4.5V: Ein multimodales Dialogmodell, das Bilder und Videos versteht und Code erzeugtDie































