Omni-Bot-SDK-OSS ist ein quelloffenes WeChat-Automatisierungsframework, das auf visueller Erkennungstechnologie basiert und RPA-Vorgänge (Robot Process Automation) der Version 4.0 von WeChat unterstützt. Durch benutzerdefinierte YOLO-Modelle und OCR-Technologie, die für Entwickler geeignet sind, um Automatisierungsaufgaben zu erstellen, erreicht es eine Null-Laufzeit-Intrusion. Benutzer können dynamisch...
Simular Browser ist ein auf künstlicher Intelligenz basierender Browser, der entwickelt wurde, um Weboperationen zu automatisieren und Benutzern zu helfen, sich wiederholende Aufgaben effizient zu erledigen. Er verwendet Befehle in natürlicher Sprache für das Surfen im Internet, das Ausfüllen von Formularen und die Datenerfassung, ohne dass komplexer Code geschrieben werden muss....
Simular Pro ist eine KI-Intelligenz, die auf einem neuronal-symbolischen Framework basiert und für macOS (Apple Silicon) entwickelt wurde. Sie automatisiert komplexe Desktop-Aufgaben durch natürlichsprachliche Befehle, die das menschliche Verhalten bei der Bedienung eines Computers nachahmen, wie z. B. Klicken, Tippen und Scrollen. Das Produkt legt Wert auf eine transparente Ausführung, und die Benutzer können jederzeit überprüfen, ob...
legacy-use ist ein Open-Source-Tool, dessen Hauptaufgabe darin besteht, eine moderne REST-API-Schnittstelle für alte, API-lose Desktop-Software (oft als "Legacy-Software" bezeichnet) bereitzustellen. Es verwendet eine KI-Intelligenz, um die grafische Benutzeroberfläche (GUI) der Software zu "beobachten" und die Tasten des menschlichen Benutzers zu...
BrowserOS ist ein Open-Source-KI-Smart-Browser, der auf Chromium entwickelt wurde und mit allen Chrome-Erweiterungen kompatibel ist. Er legt großen Wert auf den Schutz der Privatsphäre, und alle Daten und KI-Modelle laufen lokal, wobei die Benutzer die Möglichkeit haben, ihre eigenen API-Schlüssel oder lokale Modelle wie Ollama zu verwenden.
Nxtscape ist ein quelloffener intelligenter Browser mit Schwerpunkt auf dem Schutz der Privatsphäre und lokalisierten KI-Funktionen. Sein Kerndesign basiert auf der Sicherheit der Nutzerdaten und ermöglicht es den Nutzern, lokale KI-Modelle mit ihren eigenen API-Schlüsseln oder über Ollama auszuführen, wodurch sichergestellt wird, dass die Browserdaten nicht in die Cloud hochgeladen werden.Nxtscape...
Suna ist ein von Kortix AI entwickelter Open-Source-Agent für allgemeine Zwecke, der auf GitHub gehostet wird und auf der Apache 2.0-Lizenz basiert, so dass Benutzer ihn kostenlos herunterladen, verändern und selbst hosten können. Er hilft Nutzern bei komplexen Aufgaben wie Web-Browsing, Dateiverwaltung, Daten-Crawling und Website ..... durch natürlichsprachliche Dialoge.
Strawberry ist ein intelligenter Browser mit einem integrierten KI-Assistenten, der den Nutzern helfen soll, ihre täglichen Aufgaben zu automatisieren und die Effizienz zu steigern. Im Gegensatz zu herkömmlichen Browsern integriert er KI-Technologie, um Webinhalte in Echtzeit zu verstehen und komplexe Aufgaben wie schnelle Recherchen, das Schreiben von Inhalten und die Zusammenstellung von Daten durchzuführen. Benutzer können einfach...
Fellou ist der weltweit erste KI-fähige handlungsorientierte Browser von Fellou AI. Fellou ist der weltweit erste KI-fähige Action-Browser, der nicht nur die Web-Browsing-Funktionalität eines herkömmlichen Browsers bietet, sondern auch Aufgaben automatisiert und mit Hilfe von KI nach vertieften Informationen sucht...
AiPy ist ein Open-Source-Python-Befehlszeilenwerkzeug, das vom Knownsec-Team entwickelt wurde. Es kombiniert das Large Language Model (LLM) und die Python-Laufzeitumgebung, um Benutzern zu ermöglichen, automatisch Python-Code zu generieren und auszuführen, indem sie Aufgaben in natürlicher Sprache beschreiben.AiPy eignet sich für Dateningenieure, Programmierer und...
DroidRun ist ein Open-Source-Tool, mit dem KI ein Android-Telefon wie ein Mensch bedienen kann. Es hilft der KI, Aufgaben wie das Öffnen von Apps, das Senden von Nachrichten oder das Surfen im Internet zu automatisieren, indem es interaktive Elemente wie Bildschirmtasten, Eingabefelder usw. extrahiert. DroidRun kombiniert visuelles Parsing und...
Agent S ist ein von Simular AI entwickeltes Open-Source-Framework, mit dem Intelligenzen Computer über eine grafische Benutzeroberfläche (GUI) wie Menschen bedienen können. Es verwendet ein multimodales Makro-Sprachmodell und empirische Lerntechniken, um Aufgaben wie das Surfen im Internet, die Bearbeitung von Dokumenten und die Verwendung von Software durchzuführen. Das Projekt ist quelloffen auf GitHub und entwickelt...
Libra ist ein innovatives Tool von Greenbit.ai, dessen Kernfunktion darin besteht, KI-Intelligenzen zu generieren, die lokal durch natürlichsprachliche Dialoge ausgeführt werden können. Der sogenannte "Vibe Agent" ermöglicht es den Nutzern, schnell ihre eigenen Intelligenzen zu erstellen, indem sie ihre Bedürfnisse in einfachen Worten beschreiben, und eine Websuche, Datenanalyse, Visualisierung...
Optexity ist ein Open-Source-Projekt auf GitHub, das vom Optexity-Team entwickelt wurde. Sein Kern ist es, menschliche Demonstrationsdaten zu verwenden, um KI zu trainieren, um Computeraufgaben zu erledigen, insbesondere Webseitenoperationen. Das Projekt besteht aus drei Code-Bibliotheken: ComputerGYM, AgentAI und Playwright...
RunRabbit ist ein KI-basiertes Tool, mit dem Nutzer ihren Browser durch einfache Sprach- oder Textbefehle steuern können, um verschiedene Aufgaben auszuführen. Seine beste Eigenschaft ist, dass es die Bedürfnisse des Nutzers versteht und dann automatisch Webseiten manipuliert, wie z. B. die Suche nach Informationen, das Ausfüllen von Formularen oder die Ausführung sich wiederholender Aufgaben. Die Website wurde von einem Unternehmen entwickelt, das...
LangGraph CUA ist ein Open-Source-Projekt, das vom LangChain-Team entwickelt wurde. Es basiert auf dem LangGraph-Framework und ermöglicht es Entwicklern, mit Python KI-Intelligenzen zu bauen, die direkt Computer bedienen können. Der Kern dieses Tools ist der "Computer Use Agent" (CUA)...
Agent TARS ist eine multimodale KI-Intelligenz, die von ByteDance als Open Source zur Verfügung gestellt wird und deren Kernfunktionen den Benutzern helfen, komplexe Computeraufgaben zu erledigen, indem sie Webinhalte visuell verstehen und Befehlszeilen- und Dateisystemoperationen kombinieren. Anstatt wie herkömmliche Tools manuelle Eingriffe zu erfordern, automatisiert es Browseraufgaben,...
Playwright MCP ist ein Open-Source-Tool, das von Microsoft entwickelt und auf GitHub gehostet wird. Es ermöglicht Modellen der künstlichen Intelligenz die direkte Steuerung von Browsern über das Model Context Protocol (MCP), um Aktionen wie das Öffnen von Webseiten, das Anklicken von Elementen und die Eingabe von Text auszuführen. Das Tool basiert auf Pl...
Airtop ist ein KI-basiertes Browser-Automatisierungstool. Es ermöglicht Benutzern die Steuerung von Cloud-Browsern zur Durchführung komplexer Weboperationen, wie z. B. die Anmeldung bei einer Website, das Crawlen von Daten oder die Durchführung von Automatisierungsaufgaben durch einfache Befehle in natürlicher Sprache. Es löst das Problem der komplexen und fehleranfälligen traditionellen Skripterstellung...