JoyAgent-JDGenie ist ein Multi-Intelligenz-Framework, das von Jingdong als Open Source zur Verfügung gestellt wird und sich auf die Automatisierung komplexer Aufgaben konzentriert. Mit einer Genauigkeit von 75,15% schneidet es in GAIA-Benchmarks gut ab und übertrifft damit mehrere ähnliche Produkte. Das Framework ist sofort einsatzbereit, hängt nicht von Cloud-Plattformen ab und eignet sich für den lokalen Einsatz. Benutzer können Abfragen oder Aufgaben eingeben, damit das System Vorgänge wie die Codegenerierung, die Dokumentenverarbeitung und die Berichterstellung automatisiert. Es unterstützt die Montage von Sub-Intelligence oder Tools, um sich flexibel an unterschiedliche Bedürfnisse anzupassen. Der Projektcode wird auf GitHub gehostet und basiert auf der Apache-2.0-Lizenz, so dass Entwickler ihn frei verwenden und verändern können.
Funktionsliste
- Unterstützt die Zusammenarbeit mehrerer Mitarbeiter, um komplexe Aufgaben wie Code, Dokumentation, Berichterstellung usw. zu bewältigen.
- Sofort einsatzbereites Framework, das ohne komplexe Konfiguration läuft.
- Unterstützt die lokale Bereitstellung, ist nicht auf Cloud-Plattformen angewiesen und eignet sich für Anwendungen auf Unternehmensebene.
- Bietet modulare Werkzeughalterungen, die mit Sub-Intelligenzen an spezifische Bedürfnisse angepasst werden können.
- Integrierte Multitasking-Funktionen wie Code-Debugging, Datenanalyse und automatische Berichterstattung.
- Unterstützt multimodale Eingaben und verarbeitet mehrere Datentypen wie Text und Bilder.
- Bereitstellung von Beispieldaten und Testfällen für Entwickler, damit sie schnell loslegen können.
Hilfe verwenden
JoyAgent-JDGenie hat eine klare Benutzerführung für Entwickler, die es schnell in ihre Projekte integrieren können. Nachfolgend finden Sie eine detaillierte Installations- und Nutzungsanleitung, um den Benutzern den Einstieg zu erleichtern.
Einbauverfahren
- Vorbereitung der Umwelt
Stellen Sie sicher, dass Sie Python 3.8 oder höher und Git auf Ihrem System installiert haben; Linux oder macOS wird empfohlen, Windows-Nutzer müssen WSL installieren oder eine kompatible Umgebung verwenden.sudo apt update sudo apt install python3 python3-pip git
- Projektcode klonen
Laden Sie den Quellcode für JoyAgent-JDGenie aus dem GitHub-Repository herunter. Öffnen Sie ein Terminal und geben Sie den folgenden Befehl ein:git clone https://github.com/jd-opensource/joyagent-jdgenie.git cd joyagent-jdgenie
- Installation von Abhängigkeiten
Das Projekt ist auf eine Reihe von Python-Bibliotheken angewiesen, die Sie vorher installieren sollten.pip
Aktualisiert. Führen Sie den folgenden Befehl aus, um die erforderlichen Abhängigkeiten zu installieren:pip3 install --upgrade pip pip3 install -r requirements.txt
- Umgebungsvariablen konfigurieren
JoyAgent-JDGenie Unterstützung AWS Claude und die API von OpenAI als Sprachmodelltreiber. Sie müssen mindestens einen API-Schlüssel konfigurieren. bearbeiten.env
Datei (oder erstellen Sie eine neue), fügen Sie Folgendes hinzu:export OPENAI_API_KEY="你的OpenAI密钥" # 或者 export AWS_CLAUDE_API_KEY="你的Claude密钥"
Nach dem Speichern führen Sie
source .env
Aktivieren Sie die Umgebungsvariablen. - ChromeDriver installieren (optional)
Wenn Sie Webaufgaben erledigen müssen, müssen Sie ChromeDriver installieren, hier sind die Installationsbefehle für Linux:wget https://storage.googleapis.com/chrome-for-testing-public/131.0.6778.85/linux64/chromedriver-linux64.zip unzip chromedriver-linux64.zip sudo mv chromedriver /usr/bin/chromedriver sudo chmod +x /usr/bin/chromedriver
Standardmäßig läuft Chrome im Headless-Modus (keine grafische Benutzeroberfläche). Um den Browser zu visualisieren, bearbeiten Sie die Konfigurationsdatei und setzen die
headful=True
. - Überprüfen der Installation
Führen Sie den folgenden Befehl aus, um zu testen, ob das Framework ordnungsgemäß funktioniert:python3 -m simulated_web_agent.main --help
Wenn eine Hilfemeldung ausgegeben wird, war die Installation erfolgreich.
Funktion Betriebsablauf
Die Kernfunktion von JoyAgent-JDGenie ist es, komplexe Aufgaben durch multi-intelligente Zusammenarbeit zu bewältigen. Nachfolgend finden Sie die detaillierten Arbeitsabläufe der Hauptfunktionen.
1. die Durchführung der Mission
Das Projekt bietet 1.000 Beispiel-Zeichendaten (in der example_data/personas/json/
), die für Tests verwendet werden können. Der Befehl zur Ausführung der Aufgabe lautet wie folgt:
python3 -m simulated_web_agent.main --persona "example_data/personas/json/virtual customer 0.json" --output "output" --llm-provider openai
--persona
Persona: Gibt eine Persona-Datendatei an, die eine Beschreibung der Aufgabe enthält, z. B. den Kauf eines Artikels oder die Erstellung eines Berichts.--output
Geben Sie das Ausgabeverzeichnis an, in dem die Ergebnisse der Aufgabe gespeichert werden sollen.--llm-provider
: Auswahl von Sprachmodellen (openai
vielleichtclaude
).
Das Format der Zeichendaten sieht wie folgt aus:
{
"persona": "Persona: Michael ...",
"intent": "buy a large, inflatable spider decoration for halloween",
"age": 42,
"gender": "male",
"income": [30001, 94000]
}
Nach der Ausführung ruft das System Intelligenzen auf, um Vorgänge wie Web-Browsing, Datenextraktion oder Berichterstellung entsprechend den Aufgabenstellungen durchzuführen.
2. die Anpassung von Teil-Intelligenzen
JoyAgent-JDGenie unterstützt das Hinzufügen von Sub-Intelligenzen oder Werkzeugen, um spezifische Anforderungen zu erfüllen. Zum Beispiel das Hinzufügen einer Sub-Intelligenz für die Datenanalyse:
- existieren
tools/
um ein neues Werkzeugskript zu erstellen, das den Schnittstellenspezifikationen in der Projektdokumentation entspricht. - Änderungen
config.yaml
fügen Sie den Werkzeugpfad hinzu:tools: - path: "tools/custom_analyzer.py" name: "DataAnalyzer"
- Führen Sie die Aufgabe erneut aus, und das System lädt automatisch das neue Tool.
3. die Bearbeitung multimodaler Aufgaben
Das Framework unterstützt die Verarbeitung mehrerer Eingaben wie Text, Bilder usw. Laden Sie zum Beispiel ein Bild hoch und bitten Sie um eine Beschreibung:
- Legen Sie die Bilddatei in den Ordner
input/
Katalog. - Ändern Sie das Missionsprofil, um den Bildpfad und das Missionsziel anzugeben:
{ "input": "input/image.jpg", "task": "generate image description" }
- Beim Ausführen der Aufgabe ruft das System die multimodalen Intelligenzen auf, um die Ergebnisse zu generieren.
4. das Betrachten der Ausgabe
Nachdem die Aufgabe abgeschlossen ist, werden die Ergebnisse in der Datei --output
Das angegebene Verzeichnis. Die Ausgabedatei enthält das Aufgabenprotokoll, den generierten Inhalt und Debugging-Informationen. prüfen output/
Verzeichnis, um sicherzustellen, dass die Aufgabe korrekt ausgeführt wird.
caveat
- Stellen Sie sicher, dass die Netzwerkverbindung stabil ist und der API-Schlüssel gültig ist.
- Wenn die Ausführung der Aufgabe zu lange dauert, passen Sie den Wert in der Konfigurationsdatei
timeout
Parameter. - Aktualisieren Sie den Projektcode regelmäßig mit den neuesten Funktionen:
git pull origin main
Anwendungsszenario
- Automatisiertes Code-Debugging
Entwickler können JoyAgent-JDGenie verwenden, um automatisch Codefehler zu analysieren und Reparaturvorschläge zu generieren. Laden Sie eine Codedatei hoch, spezifizieren Sie die Aufgabe als "Debug Code", und das System wird den intelligenten Körper aufrufen, um eine Lösung zu analysieren und auszugeben. - Erstellen von Geschäftsberichten
Geschäftsanwender können Verkaufsdaten oder Marktforschungsaufgaben eingeben, und das System erstellt automatisch strukturierte Berichte. Ideal für die schnelle Erstellung von Finanzanalysen oder Markttrendberichten. - Web-Datenerfassung
Das System unterstützt das automatische Durchsuchen von Websites und die Datenextraktion. Wenn Sie beispielsweise "Produktpreise von E-Commerce-Plattformen erfassen" eingeben, besucht ein intelligentes Organ die Zielwebsite und liefert strukturierte Daten. - Personalisierte Aufgabenbearbeitung
Durch die Anpassung der Sub-Intelligenz können Benutzer spezifische Funktionen implementieren, wie z. B. die automatische Beantwortung von E-Mails oder die Stapelverarbeitung von Dokumenten, die sich für Büroautomatisierungsszenarien eignen.
QA
- Benötigt JoyAgent-JDGenie Unterstützung für Cloud-Dienste?
Nicht erforderlich. Das Framework unterstützt die lokale Bereitstellung und ist für Unternehmensanwendungen oder Umgebungen mit Datenschutzanforderungen geeignet. - Wie wählt man das richtige Sprachmodell?
Unterstützung für OpenAI und AWS Claude. openAI für schnelle Reaktionen, Claude für komplexe Aufgaben. Je nach Ihren Bedürfnissen können Sie die.env
Datei, um den entsprechenden API-Schlüssel zu konfigurieren. - Welche Arten von Aufgaben können bearbeitet werden?
Unterstützt werden Codegenerierung, Dokumentenverarbeitung, Berichterstellung, Web-Crawling und multimodale Aufgaben. Spezifische Aufgaben werden durch Zeichendaten oder Konfigurationsdateien definiert. - Wie kann ich die Funktionalität erweitern?
existierentools/
Verzeichnis, um benutzerdefinierte Toolskripte hinzuzufügen und dieconfig.yaml
Dokumentation. Beachten Sie die offizielle Dokumentation, um die Kompatibilität der Schnittstellen sicherzustellen.