Philosophie des Mensch-Computer-Interaktionsdesigns
Agent TARS verwendet natürliche Sprache als einheitliches Interaktionsparadigma und ist mit einer "Null-Lernkurve" konzipiert. Die Benutzer müssen keine Programmiersyntax beherrschen, sondern nur das Ziel der Aufgabe beschreiben, um das Ergebnis zu erhalten, dank des dahinter stehenden dreischichtigen Transformationsmechanismus:
- semantische Parsing-SchichtZerlegen Sie "create test.txt and write 'hello'" in zwei atomare Operationen: Dateierstellung und Schreiben des Inhalts.
- Ebene der AbsichtserkennungUnterscheidung zwischen verschiedenen Arten von Aufgaben wie Abfrage, Ausführung, Generierung usw.
- Bewegungs-Choreografie-EbeneAutomatischer Umgang mit Abhängigkeiten zwischen Operationen, z.B. sicherstellen, dass ein Verzeichnis existiert, bevor eine Datei erstellt wird
Tests in der Praxis haben gezeigt, dass auch technisch nicht versierte Anwender den 85% für gängige Büroautomatisierungsaufgaben in Alltagssprache verwenden können, während Entwickler durch Hinzufügen von Befehlszeilenparametern dennoch erweiterte Steuerungsmöglichkeiten haben - ein ausgewogenes Design, das den Anwendungsbereich des Tools erheblich erweitert.
Diese Antwort stammt aus dem ArtikelAgent TARS: eine Open-Source-Intelligenz, die mit Hilfe von Vision und Befehlen Computer steuertDie































