OpenAgents ist eine Open-Source-Plattform, die es Nutzern ermöglichen soll, mit Intelligenzen durch natürliche Sprache zu interagieren, um Aufgaben wie Datenanalyse, Plug-in-Aufrufe und Web-Browsing durchzuführen. Sie wurde vom XLANG NLP Lab an der Universität Hongkong entwickelt und enthält drei Kernintelligenzen: Data Intelligence, Plug-in Intelligence und Web Intelligence. Die Plattform bietet eine intuitive Weboberfläche, die normalen Nutzern einen schnellen Einstieg ermöglicht, und unterstützt den lokalen Einsatz durch Entwickler und Forscher, um die Entwicklung innovativer linguistischer Intelligenzen zu erleichtern.OpenAgents legt Wert auf Open Source und die Zusammenarbeit mit der Community und ermutigt Nutzer, Code und Feedback beizusteuern, um die Anwendung linguistischer Intelligenzen in der realen Welt zu fördern. Der Projektcode wird auf GitHub gehostet, mit einer detaillierten Dokumentation und einem klaren Bereitstellungsprozess, der für eine breite Palette von Nutzergruppen geeignet ist.
Funktionsliste
- Data Intelligence Body: Unterstützt die Datenanalyse mit Python und SQL, um Diagramme und Berichte zu erstellen.
- Plugin Intelligence Body: Integriert über 200 Plugins von Drittanbietern, um alltägliche Aufgaben wie Wettervorhersage, Online-Shopping und vieles mehr abzudecken.
- Web Intelligentsia: Ermöglicht das autonome Surfen im Internet und führt Such- und Informationsextraktionsaufgaben durch.
- Webschnittstelle: Bietet eine chatbasierte interaktive Schnittstelle, die für schnelle Reaktionen und Fehlerbehandlung optimiert ist.
- Lokale Bereitstellung: Unterstützt die lokale Erstellung über Docker oder Quellcode, geeignet für Entwicklung und Forschung.
- Beitrag der Gemeinschaft: offener Code und Dokumentation, Ermutigung der Benutzer, Probleme und Code-Verbesserungen einzureichen.
- Mehrsprachige Unterstützung: Stellen Sie Dokumente in Chinesisch, Englisch, Koreanisch, Japanisch usw. zur Verfügung, um den Komfort der weltweiten Benutzer zu erhöhen.
Hilfe verwenden
Installation und Einsatz
OpenAgents unterstützt die lokale Bereitstellung über Docker oder Quellcode. Hier ist der detaillierte Installations- und Nutzungsprozess:
1. die Bereitstellung mit Docker
Die Docker-Bereitstellung eignet sich für die schnelle Einrichtung von Testumgebungen, kann aber zu Instabilität oder langsamen Reaktionen führen. Erfahrenen Benutzern wird empfohlen, direkt aus dem Quellcode bereitzustellen, um ein stabileres Ergebnis zu erzielen.
umziehen::
- Installation von DockerStellen Sie sicher, dass Docker und Docker Compose auf Ihrem System installiert sind, und installieren Sie zusätzlich das Nvidia Container Toolkit, wenn Sie GPU-Unterstützung benötigen.
- Klonen der Codebasis::
git clone https://github.com/xlang-ai/OpenAgents.git cd OpenAgents
- Konfiguration der Umgebung:: Leitartikel
docker-compose.yml
Datei. Wenn Sie die OpenAI-API verwenden, müssen Sie dieOPENAI_API_KEY
Wenn Sie einen anderen Dienst (z. B. FastChat) verwenden, müssen Sie Ihre Einstellungen ändern. Wenn Sie andere Dienste (z. B. FastChat) verwenden, müssen Sie dieOPENAI_API_BASE
. - GPU einschalten (optional): Annullierung
docker-compose.yml
um die GPU-Unterstützung zu aktivieren. - Erstellen und Starten des Dienstes::
docker compose build docker compose up -d
- ZugangsdienstNachdem der Dienst gestartet wurde, rufen Sie ihn über Ihren Browser auf.
http://localhost:8000
Rufen Sie die Webschnittstelle auf. - caveatWenn Sie den Kaggle-Datensatz verwenden, müssen Sie die
Dockerfile
Die Informationen in der Datei Hugging Face weights finden Sie in der Datei Wenn Sie auf Netzwerkprobleme stoßen (z. B. Zeitüberschreitung beim Herunterladen der Datei Hugging Face weights), müssen Sie diese selbst beheben.
2. die Bereitstellung aus dem Quellcode
Der Quellcode ist stabiler und eignet sich für Benutzer, die Anpassungen oder Entwicklungen vornehmen müssen.
umziehen::
- Installation von AbhängigkeitenStellen Sie sicher, dass Python 3.8+ und Node.js auf Ihrem System installiert sind.
- Klonen der CodebasisWie der Schritt des Klonens bei einer Docker-Bereitstellung.
- Installation von Backend-Abhängigkeiten::
cd backend pip install -r requirements.txt
- Installation von Front-End-Abhängigkeiten::
cd frontend npm install
- Konfigurieren des Backends: in
backend
Verzeichnis, um Umgebungsvariablen zu setzen, z. B.OPENAI_API_KEY
. - Priming Backend::
python main.py
- Launch Front End::
cd frontend npm run dev
- Zugangsdienst: Das Front-End läuft standardmäßig auf dem
http://localhost:3000
Das Backend läuft aufhttp://localhost:8000
.
3. die Verwendung der OpenAgents-Funktion
Die Kernfunktionen von OpenAgents werden über eine Weboberfläche bedient, die intuitiv gestaltet ist und an eine Chat-Anwendung erinnert. Im Folgenden wird beschrieben, wie die einzelnen SmartBodys zu bedienen sind:
Daten intelligent::
- FunktionalitätErledigt Datenanalyseaufgaben und unterstützt die Erstellung und Ausführung von Python- und SQL-Code.
- Arbeitsablauf::
- Öffnen Sie die Weboberfläche und wählen Sie "Data Intelligence".
- Geben Sie eine Aufgabe in das Chat-Feld ein, z. B. "Analysieren Sie die Datei sales_data.csv, um ein Trenddiagramm der Verkäufe zu erstellen".
- Der intelligente Körper generiert automatisch den Code und führt ihn aus, und die Ergebnisse (z. B. Diagramme oder Berichte) werden in der Schnittstelle angezeigt.
- Die Ergebnisse können heruntergeladen werden oder Sie können die Aufgabenanforderungen weiter ändern.
- zur Kenntnis nehmenDie hochgeladene Datendatei sollte im Format CSV, JSON usw. vorliegen und der Dateipfad sollte korrekt konfiguriert sein.
Plug-in Intelligenzia::
- FunktionalitätIntegration von mehr als 200 Plug-ins zur Unterstützung von Wetterabfragen, Online-Shopping, wissenschaftlichen Berechnungen und mehr.
- Arbeitsablauf::
- Wählen Sie in der Weboberfläche "Plug-in Intelligence".
- Geben Sie eine Aufgabe ein, z. B. "Informieren Sie sich morgen über das Wetter in Shanghai" oder "Helfen Sie mir bei der Suche nach den neuesten Handys".
- Intelligente Stellen rufen die entsprechenden Plug-ins auf und liefern die Ergebnisse in Echtzeit.
- Unterstützung mehrerer Plug-ins gleichzeitig, z. B. "Planen Sie eine Reise von Peking nach Shanghai" wird das Wetter, Tickets und andere Plug-ins aufrufen.
- zur Kenntnis nehmenEinige Plugins können zusätzliche API-Schlüssel erfordern, die im Backend konfiguriert werden müssen.
Web-Intelligenz::
- FunktionalitätAutonomes Surfen im Internet, Durchführung von Aufgaben wie Suche und Extraktion von Informationen.
- Arbeitsablauf::
- Wählen Sie "Web Intelligence" und geben Sie eine Aufgabe ein, z. B. "Suche nach den neuesten Nachrichten über KI-Konferenzen".
- Der intelligente Körper öffnet automatisch einen Browser, führt eine Suche durch und extrahiert wichtige Informationen.
- Die Ergebnisse werden als Text oder Links zurückgegeben.
- zur Kenntnis nehmen: Die Internetverbindung muss stabil sein, da einige Websites aufgrund von Beschränkungen möglicherweise nicht zugänglich sind.
4. gemeinschaftliche Unterstützung und Feedback zu Themen
- Zugang zu DokumentenAusführliche Dokumentation finden Sie unter
https://github.com/xlang-ai/OpenAgents
einschließlich Konzepte, Entwürfe und Anwendungsfälle. - Frage FeedbackUm einen Fehler auf GitHub zu melden, folgen Sie der
CONTRIBUTING.md
Leitfaden. - Gemeinschaftlicher Austausch: Treten Sie der Discord-Community bei, um Live-Hilfe zu erhalten.
5. die Entwicklung und Erweiterung
Entwickler können OpenAgents durch die folgenden Schritte erweitern:
- Hinzufügen neuer Informationen: in
frontend/types/agent.ts
Definieren Sie eine neue Smartbody-ID in derfrontend/utils/app/api.ts
im Gesang antwortenconst.ts
. - Unterstützung für neue Datentypen: in
backend/display_streaming.py
Hinzufügen der Parsing-Logik zur - Integration des neuen LLM: in
backend/api/language_model.py
Registrieren Sie ein neues Modell, siehelemur-chat
Vorlage.
Anwendungsszenario
- Datenanalyse
Vermarkter können Verkaufsdaten hochladen und schnell Trenddiagramme erstellen, um Zeit bei der manuellen Analyse zu sparen. - Verwaltung der täglichen Aufgaben
Die Nutzer prüfen das Wetter, buchen Flüge oder verwalten ihre Termine mit Plug-in-Intelligenz für mehr Effizienz. - Informationsabfrage
Forscher nutzen Web-Intelligenzen, um nach Informationen über wissenschaftliche Konferenzen zu suchen und die wichtigsten Inhalte automatisch zusammenzustellen. - Entwicklungstests
Entwickler setzen OpenAgents lokal ein, um die Integration neuer Intelligenzen oder Plug-ins zu testen.
QA
- Welche Sprachen werden von OpenAgents unterstützt?
Die Plattform bietet eine mehrsprachige Dokumentation in Chinesisch, Englisch, Koreanisch und Japanisch, und die Benutzeroberfläche unterstützt sowohl Englisch als auch Chinesisch. - Sind Programmierkenntnisse erforderlich?
Normale Benutzer können über die Weboberfläche ohne Programmierung arbeiten; Entwickler müssen sich mit Python und JavaScript auskennen, um die Software einzusetzen oder zu erweitern. - Wie lange dauert die Bereitstellung?
Die Bereitstellung von Docker dauert etwa 10-20 Minuten, die Bereitstellung des Quellcodes etwa 30 Minuten, je nach Hardware- und Netzwerkbedingungen. - Was ist zu tun, wenn Sie Probleme bei der Bereitstellung haben?
Sondedocker-compose.yml
Konfiguration, schauen Sie in die GitHub-Dokumentation oder fragen Sie in Discord nach Hilfe. - Wird das Mobiltelefon unterstützt?
Derzeit ist das System in erster Linie webbasiert, die mobile Unterstützung befindet sich in der Entwicklung und kann über einen Browser aufgerufen werden.