Youtu-agent: ein Rahmen für KI-Intelligenzen, die Computer bedienen, um Aufgaben zu automatisieren
Youtu-agent ist ein leistungsfähiges und übersichtliches Framework für KI-Intelligenzen, das von Tencent Youtu Lab entwickelt wurde. Es wurde speziell für den Aufbau, den Betrieb und die Bewertung von autonomen KI-Intelligenzen entwickelt. Das Hauptmerkmal ist die vollständige Einbeziehung von Open-Source-Modellen und die Erzielung einer hervorragenden Leistung, ohne sich auf große Closed-Source-Modelle zu verlassen. Das Framework wurde ...
Ninja AI: Automatisierung von Browser-Aufgaben mit AI Intelligentsia
Ninja AI 是一款人工智能(AI)智能体,它可以在用户的浏览器中运行,用于自动执行各种在线任务。这个工具的设计目标是像一个忍者一样,悄无声息地处理那些需要在浏览器中完成的、重复性高或耗时的工作。用户可以...
Asteroid AI: Künstliche Intelligenz Browser-Intelligenz für die Automatisierung von Geschäftsprozessen
Asteroid AI ist eine Browser-Automatisierungsplattform mit künstlicher Intelligenz, die es Nutzern ermöglicht, schnell "Browser-Intelligenzen" zu entwickeln, um sich wiederholende Vorgänge auf Webseiten anstelle von Menschen zu automatisieren. Das Tool kann sowohl von technischen Entwicklern als auch von nichttechnischen Geschäftsleuten verwendet werden. Die Benutzer visualisieren die Schnittstelle...
AutoGLM: Automatisierte Bedienung von Computern und Mobiltelefonen mit Hilfe von sprach- und textgesteuerten Intelligenzen
AutoGLM ist eine von ZhipuAI (ZhipuAI) entwickelte KI-Anwendung für intelligente Körper. Es handelt sich nicht um einen einfachen Chatbot, sondern um einen Assistenten, der tatsächlich arbeiten kann. Benutzer können AutoGLM durch einfache Befehle in natürlicher Sprache verschiedene Aufgaben auf einem virtuellen Computer oder Mobiltelefon in der Cloud selbstständig erledigen lassen...
Bytebot: Automatisierung von Desktop-Aufgaben in Linux-Containern mit natürlicher Sprache
Bytebot ist ein quelloffener, selbstgehosteter KI-Desktop-Agent, der in einer containerisierten Linux-Umgebung läuft und Computeraufgaben durch natürlichsprachliche Befehle automatisiert. Er ahmt die Art und Weise nach, wie ein Mensch einen Computer bedient, indem er die Tastatur, die Maus und den Bildschirm verwendet, um Aufgaben wie das Surfen im Internet, die Datenverarbeitung, die Dateiverwaltung usw. auszuführen.Bytebot...
Browserfly: das intelligente Plugin, das KI zur Automatisierung von Browsern einsetzt
Browserfly ist ein KI-gestütztes Browser-Plugin, das direkt im vorhandenen Browser des Nutzers läuft. Es ermöglicht der KI, Webseiten wie ein Mensch durch natürlichsprachliche Befehle für Aufgaben wie die Suche, die Organisation von Informationen oder die Verwaltung von Tabs zu manipulieren. Eine virtuelle Maschine oder ein zusätzlicher Browser sind nicht erforderlich. Installieren Sie es und es ist sofort in Chrome oder Edge einsatzbereit...
Eigent: eine Open-Source-Desktop-Anwendung für automatisierte Multi-Intelligence-Zusammenarbeit
Eigent ist die weltweit erste kollaborative Desktop-Anwendung für mehrere Intelligenzen, die auf dem Open-Source-Projekt CAMEL-AI basiert. Sie wurde entwickelt, um Nutzern zu helfen, Teams von KI-Intelligenzen aufzubauen und zu verwalten und komplexe Aufgaben zu automatisieren. Sie unterstützt die lokale Bereitstellung und den Cloud-Betrieb und bietet eine hochgradig anpassbare Tool-Integration und Datenschutz....
CopyCat: KI-Tool zur Automatisierung von Browseraufgaben
CopyCat ist ein KI-gestütztes Browser-Automatisierungstool, das Unternehmen und Privatpersonen dabei helfen soll, sich wiederholende Aufgaben im Internet zu vereinfachen. Durch die Kombination von intelligenten Browser-Agenten und deterministischen Operationen ermöglicht es Benutzern, automatisierte Arbeitsabläufe zu erstellen, ohne Code zu schreiben.CopyCat unterstützt...
NeuralAgent: eine KI-Intelligenz, die Sprache und Text verwendet, um einen Computer zu steuern und Aufgaben zu erledigen
NeuralAgent ist ein quelloffenes KI-Tool für intelligente Körper, das auf dem lokalen Computer des Benutzers läuft. Es führt eine Vielzahl von Aufgaben aus, indem es menschliche Aktionen wie Klicken, Tippen, Scrollen und Navigieren in der Anwendung simuliert. Der Benutzer gibt einfach Befehle in natürlicher Sprache ein und NeuralAgent führt sie automatisch aus, z. B. das Ausfüllen von Formularen, das Senden von...
Gabriel Operator: der KI-Assistent, der Browser in intelligente Arbeitsbereiche verwandelt
Gabriel Operator ist ein Tool, das den Browser in einen intelligenten Arbeitsbereich verwandelt. Es hilft Anwendern, Aufgaben zu automatisieren, Support zu leisten und sich durch KI-Browser-Agenten an verschiedene Arbeitsszenarien anzupassen. Die Benutzer können KI-Funktionen direkt im Browser nutzen, um die täglichen Abläufe zu vereinfachen und die Produktivität zu steigern....
Magentic-UI: Ein intelligentes Agententool zur Unterstützung der Zusammenarbeit von Benutzern bei Web-Aufgaben
Magentic-UI ist ein von Microsoft Research entwickeltes Open-Source-Tool für intelligente Agenten, das Benutzern helfen soll, komplexe Webaufgaben durch Zusammenarbeit zu erledigen. Es basiert auf dem AutoGen-Framework und kombiniert ein Multi-Agenten-System, um eine transparente und kontrollierte Benutzererfahrung zu bieten....
OpenDia: ein Open-Source-Tool zur Verbindung von Browsern mit KI-Modellen
OpenDia ist ein Open-Source-Projekt, das darauf abzielt, KI-Modelle über das Model Context Protocol (MCP)-Protokoll nahtlos mit Browsern zu verbinden. Benutzer können die OpenDia-Erweiterung auf Browsern wie Chrome, Firefox usw. installieren und sie mit dem lokal laufenden MCP-Protokoll kombinieren...
Omni-Bot-SDK-OSS: Ein auf visueller Erkennung basierender Automatisierungsrahmen für WeChat RPA
Omni-Bot-SDK-OSS ist ein quelloffenes WeChat-Automatisierungsframework, das auf visueller Erkennungstechnologie basiert und RPA-Vorgänge (Robot Process Automation) der Version 4.0 von WeChat unterstützt. Durch benutzerdefinierte YOLO-Modelle und OCR-Technologie, die für Entwickler geeignet sind, um Automatisierungsaufgaben zu erstellen, erreicht es eine Null-Laufzeit-Intrusion. Benutzer können dynamisch...
Simular Browser: ein KI-Browser, der Webvorgänge auf intelligente Weise automatisiert
Simular Browser ist ein auf künstlicher Intelligenz basierender Browser, der entwickelt wurde, um Weboperationen zu automatisieren und Benutzern zu helfen, sich wiederholende Aufgaben effizient zu erledigen. Er verwendet Befehle in natürlicher Sprache für das Surfen im Internet, das Ausfüllen von Formularen und die Datenerfassung, ohne dass komplexer Code geschrieben werden muss....
Simular Pro: eine KI-Intelligenz, die Computer mithilfe von Sprache und Text steuert, um automatisierte Aufgaben zu erledigen
Simular Pro ist eine KI-Intelligenz, die auf einem neuronal-symbolischen Framework basiert und für macOS (Apple Silicon) entwickelt wurde. Sie automatisiert komplexe Desktop-Aufgaben durch natürlichsprachliche Befehle, die das menschliche Verhalten bei der Bedienung eines Computers nachahmen, wie z. B. Klicken, Tippen und Scrollen. Das Produkt legt Wert auf eine transparente Ausführung, und die Benutzer können jederzeit überprüfen, ob...
WebAgent: Ein intelligentes Werkzeug zur Suche und Verarbeitung von Webinformationen
WebAgent ist ein Open-Source-Projekt, das von Alibaba Tongyi Lab entwickelt wurde und sich auf die intelligente Suche und Verarbeitung von Webinformationen konzentriert. Es besteht aus drei Hauptkomponenten: WebWalker, WebDancer und WebSailor. Diese Tools verwenden fortschrittliche Sprachmodelle und Reinforcement-Learning-Techniken, um den Benutzern zu helfen,...
Legacy-Nutzung: Hinzufügen von KI-Automatisierungsschnittstellen zu älterer Software ohne APIs
legacy-use ist ein Open-Source-Tool, dessen Hauptaufgabe darin besteht, eine moderne REST-API-Schnittstelle für alte, API-lose Desktop-Software (oft als "Legacy-Software" bezeichnet) bereitzustellen. Es verwendet eine KI-Intelligenz, um die grafische Benutzeroberfläche (GUI) der Software zu "beobachten" und die Tasten des menschlichen Benutzers zu...
BrowserOS: Open Source AI Smart Browser
BrowserOS ist ein Open-Source-KI-Smart-Browser, der auf Chromium entwickelt wurde und mit allen Chrome-Erweiterungen kompatibel ist. Er legt großen Wert auf den Schutz der Privatsphäre, und alle Daten und KI-Modelle laufen lokal, wobei die Benutzer die Möglichkeit haben, ihre eigenen API-Schlüssel oder lokale Modelle wie Ollama zu verwenden.
Windows-MCP: Open-Source-Tool für leichtgewichtige KI-Kontrolle von Windows-Systemen
Windows-MCP ist ein leichtgewichtiges Open-Source-Projekt, das es KI-Agenten ermöglichen soll, das Windows-Betriebssystem direkt über ein Large Language Model (LLM) zu steuern. Es vereinfacht den Einrichtungsprozess, indem es die Notwendigkeit beseitigt, sich auf traditionelle Computer-Vision-Techniken oder spezifische Modelle zu verlassen. Benutzer können einfache Tools verwenden, um Tastatur- und Mausoperationen zu implementieren sowie...
zurück zum Anfang