OpenAdapt: ein Open-Source-Tool für die automatische Bearbeitung von Computeranwendungen mit großen Modellen
OpenAdapt ist ein Open-Source-Software-Tool, das leistungsstarke Large Multimodal Models (LMMs) mit der grafischen Benutzeroberfläche (GUI) eines Computers verbindet, um Prozesse zu automatisieren. Traditionell wird ein großer Teil des geistigen Aufwands für sich wiederholende Computeroperationen verschwendet, und OpenAdapt zielt darauf ab, dieses Problem zu lösen.
Schritt KI-Desktop-Intelligenzen: Desktop-Intelligenzen, die natürliche Sprache zur Bedienung von Computern verwenden
Step AI Desktop Partner ist ein Assistent mit künstlicher Intelligenz, der auf dem Betriebssystem Ihres PCs läuft und die natürlichsprachlichen Befehle des Benutzers für verschiedene Computeroperationen versteht und ausführt. Dieses Tool ist nicht auf Browser beschränkt und kann direkt mit dem Betriebssystem interagieren, um lokale Dateien zu verwalten, auf das Internet zuzugreifen und...
Youtu-agent: ein Rahmen für KI-Intelligenzen, die Computer bedienen, um Aufgaben zu automatisieren
Youtu-agent ist ein leistungsfähiges und übersichtliches Framework für KI-Intelligenzen, das von Tencent Youtu Lab entwickelt wurde. Es wurde speziell für den Aufbau, den Betrieb und die Bewertung von autonomen KI-Intelligenzen entwickelt. Das Hauptmerkmal ist die vollständige Einbeziehung von Open-Source-Modellen und die Erzielung einer hervorragenden Leistung, ohne sich auf große Closed-Source-Modelle zu verlassen. Das Framework wurde ...
Ninja AI: Automatisierung von Browser-Aufgaben mit AI Intelligentsia
Ninja AI ist eine künstliche Intelligenz (KI), die im Browser des Benutzers läuft und zur Automatisierung verschiedener Online-Aufgaben verwendet wird. Das Tool wurde mit dem Ziel entwickelt, wie ein Ninja zu handeln und sich stillschweigend um sich wiederholende oder zeitraubende Aufgaben zu kümmern, die im Browser erledigt werden müssen. Benutzer können...
Asteroid AI: Künstliche Intelligenz Browser-Intelligenz für die Automatisierung von Geschäftsprozessen
Asteroid AI ist eine Browser-Automatisierungsplattform mit künstlicher Intelligenz, die es Nutzern ermöglicht, schnell "Browser-Intelligenzen" zu entwickeln, um sich wiederholende Vorgänge auf Webseiten anstelle von Menschen zu automatisieren. Das Tool kann sowohl von technischen Entwicklern als auch von nichttechnischen Geschäftsleuten verwendet werden. Die Benutzer visualisieren die Schnittstelle...
AutoGLM: Automatisierte Bedienung von Computern und Mobiltelefonen mit Hilfe von sprach- und textgesteuerten Intelligenzen
AutoGLM ist eine von ZhipuAI (ZhipuAI) entwickelte KI-Anwendung für intelligente Körper. Es handelt sich nicht um einen einfachen Chatbot, sondern um einen Assistenten, der tatsächlich arbeiten kann. Benutzer können AutoGLM durch einfache Befehle in natürlicher Sprache verschiedene Aufgaben auf einem virtuellen Computer oder Mobiltelefon in der Cloud selbstständig erledigen lassen...
Bytebot: Automatisierung von Desktop-Aufgaben in Linux-Containern mit natürlicher Sprache
Bytebot ist ein quelloffener, selbstgehosteter KI-Desktop-Agent, der in einer containerisierten Linux-Umgebung läuft und Computeraufgaben durch natürlichsprachliche Befehle automatisiert. Er ahmt die Art und Weise nach, wie ein Mensch einen Computer bedient, indem er die Tastatur, die Maus und den Bildschirm verwendet, um Aufgaben wie das Surfen im Internet, die Datenverarbeitung, die Dateiverwaltung usw. auszuführen.Bytebot...
Browserfly: das intelligente Plugin, das KI zur Automatisierung von Browsern einsetzt
Browserfly ist ein KI-gestütztes Browser-Plugin, das direkt im vorhandenen Browser des Nutzers läuft. Es ermöglicht der KI, Webseiten wie ein Mensch durch natürlichsprachliche Befehle für Aufgaben wie die Suche, die Organisation von Informationen oder die Verwaltung von Tabs zu manipulieren. Eine virtuelle Maschine oder ein zusätzlicher Browser sind nicht erforderlich. Installieren Sie es und es ist sofort in Chrome oder Edge einsatzbereit...
Eigent: eine Open-Source-Desktop-Anwendung für automatisierte Multi-Intelligence-Zusammenarbeit
Eigent ist die weltweit erste kollaborative Desktop-Anwendung für mehrere Intelligenzen, die auf dem Open-Source-Projekt CAMEL-AI basiert. Sie wurde entwickelt, um Nutzern zu helfen, Teams von KI-Intelligenzen aufzubauen und zu verwalten und komplexe Aufgaben zu automatisieren. Sie unterstützt die lokale Bereitstellung und den Cloud-Betrieb und bietet eine hochgradig anpassbare Tool-Integration und Datenschutz....
CopyCat: KI-Tool zur Automatisierung von Browseraufgaben
CopyCat ist ein KI-gestütztes Browser-Automatisierungstool, das Unternehmen und Privatpersonen dabei helfen soll, sich wiederholende Aufgaben im Internet zu vereinfachen. Durch die Kombination von intelligenten Browser-Agenten und deterministischen Operationen ermöglicht es Benutzern, automatisierte Arbeitsabläufe zu erstellen, ohne Code zu schreiben.CopyCat unterstützt...
NeuralAgent: eine KI-Intelligenz, die Sprache und Text verwendet, um einen Computer zu steuern und Aufgaben zu erledigen
NeuralAgent ist ein quelloffenes KI-Tool für intelligente Körper, das auf dem lokalen Computer des Benutzers läuft. Es führt eine Vielzahl von Aufgaben aus, indem es menschliche Aktionen wie Klicken, Tippen, Scrollen und Navigieren in der Anwendung simuliert. Der Benutzer gibt einfach Befehle in natürlicher Sprache ein und NeuralAgent führt sie automatisch aus, z. B. das Ausfüllen von Formularen, das Senden von...
Gabriel Operator: der KI-Assistent, der Browser in intelligente Arbeitsbereiche verwandelt
Gabriel Operator ist ein Tool, das den Browser in einen intelligenten Arbeitsbereich verwandelt. Es hilft Anwendern, Aufgaben zu automatisieren, Support zu leisten und sich durch KI-Browser-Agenten an verschiedene Arbeitsszenarien anzupassen. Die Benutzer können KI-Funktionen direkt im Browser nutzen, um die täglichen Abläufe zu vereinfachen und die Produktivität zu steigern....
Magentic-UI: Ein intelligentes Agententool zur Unterstützung der Zusammenarbeit von Benutzern bei Web-Aufgaben
Magentic-UI ist ein von Microsoft Research entwickeltes Open-Source-Tool für intelligente Agenten, das Benutzern helfen soll, komplexe Webaufgaben durch Zusammenarbeit zu erledigen. Es basiert auf dem AutoGen-Framework und kombiniert ein Multi-Agenten-System, um eine transparente und kontrollierte Benutzererfahrung zu bieten....
OpenDia: ein Open-Source-Tool zur Verbindung von Browsern mit KI-Modellen
OpenDia ist ein Open-Source-Projekt, das darauf abzielt, KI-Modelle über das Model Context Protocol (MCP)-Protokoll nahtlos mit Browsern zu verbinden. Benutzer können die OpenDia-Erweiterung auf Browsern wie Chrome, Firefox usw. installieren und sie mit dem lokal laufenden MCP-Protokoll kombinieren...
Omni-Bot-SDK-OSS: Ein auf visueller Erkennung basierender Automatisierungsrahmen für WeChat RPA
Omni-Bot-SDK-OSS ist ein quelloffenes WeChat-Automatisierungsframework, das auf visueller Erkennungstechnologie basiert und RPA-Vorgänge (Robot Process Automation) der Version 4.0 von WeChat unterstützt. Durch benutzerdefinierte YOLO-Modelle und OCR-Technologie, die für Entwickler geeignet sind, um Automatisierungsaufgaben zu erstellen, erreicht es eine Null-Laufzeit-Intrusion. Benutzer können dynamisch...
Simular Browser: ein KI-Browser, der Webvorgänge auf intelligente Weise automatisiert
Simular Browser ist ein auf künstlicher Intelligenz basierender Browser, der entwickelt wurde, um Weboperationen zu automatisieren und Benutzern zu helfen, sich wiederholende Aufgaben effizient zu erledigen. Er verwendet Befehle in natürlicher Sprache für das Surfen im Internet, das Ausfüllen von Formularen und die Datenerfassung, ohne dass komplexer Code geschrieben werden muss....
Simular Pro: eine KI-Intelligenz, die Computer mithilfe von Sprache und Text steuert, um automatisierte Aufgaben zu erledigen
Simular Pro ist eine KI-Intelligenz, die auf einem neuronal-symbolischen Framework basiert und für macOS (Apple Silicon) entwickelt wurde. Sie automatisiert komplexe Desktop-Aufgaben durch natürlichsprachliche Befehle, die das menschliche Verhalten bei der Bedienung eines Computers nachahmen, wie z. B. Klicken, Tippen und Scrollen. Das Produkt legt Wert auf eine transparente Ausführung, und die Benutzer können jederzeit überprüfen, ob...
WebAgent: Ein intelligentes Werkzeug zur Suche und Verarbeitung von Webinformationen
WebAgent ist ein Open-Source-Projekt, das von Alibaba Tongyi Lab entwickelt wurde und sich auf die intelligente Suche und Verarbeitung von Webinformationen konzentriert. Es besteht aus drei Hauptkomponenten: WebWalker, WebDancer und WebSailor. Diese Tools verwenden fortschrittliche Sprachmodelle und Reinforcement-Learning-Techniken, um den Benutzern zu helfen,...
Legacy-Nutzung: Hinzufügen von KI-Automatisierungsschnittstellen zu älterer Software ohne APIs
legacy-use ist ein Open-Source-Tool, dessen Hauptaufgabe darin besteht, eine moderne REST-API-Schnittstelle für alte, API-lose Desktop-Software (oft als "Legacy-Software" bezeichnet) bereitzustellen. Es verwendet eine KI-Intelligenz, um die grafische Benutzeroberfläche (GUI) der Software zu "beobachten" und die Tasten des menschlichen Benutzers zu...
zurück zum Anfang