OpenDia ist ein Open-Source-Projekt mit folgenden Zielen Modell-Kontext-Protokoll (MCPOpenDia unterstützt eine Vielzahl von Funktionen wie Seitenanalyse, Inhaltsextraktion, dynamische Lesezeichen und Browser-Automatisierung in Verbindung mit lokal laufenden MCP-Servern. Nutzer können die OpenDia-Erweiterung auf Browsern wie Chrome, Firefox usw. installieren, um Browseroperationen in Verbindung mit einem lokal laufenden MCP-Server zu automatisieren.OpenDia unterstützt eine Vielzahl von Funktionen wie Seitenanalyse, Inhaltsextraktion, dynamische Lesezeichenverwaltung und Anpassung des Seitenstils. OpenDia läuft vollständig lokal, mit dem Fokus auf Datenschutz, und ist nicht auf Cloud-Dienste angewiesen. Das Projekt ist unter der MIT-Lizenz lizenziert und der Code ist auf GitHub öffentlich zugänglich, damit Entwickler und Technologiebegeisterte ihn erforschen und beitragen können. Die neueste Version, v1.1, unterstützt Firefox und Remote-Betrieb für eine stabilere Funktionalität.
Funktionsliste
- Intelligente Seitenanalyse: Extrahiert Webseiteninhalte zur Verarbeitung durch KI-Modelle.
- Automatisierte Vorgänge: Unterstützung beim Anklicken von Schaltflächen, Ausfüllen von Formularen und Navigieren auf Webseiten.
- Dynamische Lesezeichenverwaltung: Schnelles Abrufen des Browserverlaufs anhand von Schlüsselwörtern oder Themen.
- Anpassung des Seitenstils: Passen Sie das Erscheinungsbild von Webseiten an, um die Benutzerfreundlichkeit zu optimieren.
- Hintergrundbetrieb: Unterstützung des Betriebs von Seiten mit mehreren Registern, um einen effizienten Arbeitsablauf zu gewährleisten.
- Datenschutz: Alle Vorgänge laufen lokal ab und es werden keine Daten in die Cloud hochgeladen.
- Browserübergreifende Unterstützung: Kompatibel mit Chrome, Firefox, Edge, Brave und mehr.
- Fernsteuerung: Unterstützt die Fernsteuerung über verschiedene Geräte oder Claude Browser-Bedienung.
Hilfe verwenden
Einbauverfahren
Um OpenDia zu nutzen, müssen Sie sowohl die Server- als auch die Browser-Erweiterung installieren. Nachfolgend finden Sie die detaillierten Schritte:
- Installation von Node.js
OpenDia basiert auf Node.js (v14 oder höher). Besuchen Sie die offizielle Node.js-Website, um die entsprechende Version für Ihr Betriebssystem herunterzuladen und zu installieren. Sobald die Installation abgeschlossen ist, führen Sie den folgenden Befehl aus, um zu bestätigen, dass die Installation erfolgreich war:node --version
- Klonen des OpenDia-Projekts
Laden Sie den OpenDia-Quellcode herunter, indem Sie den folgenden Befehl in einem Terminal oder einer Befehlszeile ausführen:git clone https://github.com/aaronjmars/opendia.git cd opendia
- Starten des MCP-Servers
Wechseln Sie in das Serververzeichnis und installieren Sie die Abhängigkeiten:cd opendia-mcp npm install npm start
Standardmäßig läuft der Server auf
localhost:5555
(WebSocket-Anschluss). Für einen benutzerdefinierten Anschluss verwenden Sie:npx opendia --ws-port=5555 --http-port=5556
Im Falle eines Portkonflikts beendet OpenDia automatisch den bestehenden Prozess und bindet ihn neu ein.
- Installieren von Browser-Erweiterungen
- Chrom
Öffnen Sie Chrome und gehen Sie zuchrome://extensions/
Klicken Sie auf die Schaltfläche "Entwicklermodus", um den "Entwicklermodus" zu aktivieren. Klicken Sie auf "Ungezippte Erweiterungen laden" und wählen Sie./opendia-extension/dist/chrome
Ordner. Die Erweiterung stellt automatisch eine Verbindung mit dem lokalen Server her. - Firefox-Browser
Öffnen Sie Firefox und gehen Sie zuabout:debugging#/runtime/this-firefox
Klicken Sie auf "Temporäre Add-ons laden" und wählen Sie./opendia-extension/dist/firefox/manifest.json
Datei. Die Erweiterung ist geladen und einsatzbereit. - Für andere Chromium-Browser (z. B. Edge, Brave), siehe die Installationsschritte für Chrome.
- Chrom
- Überprüfen der Verbindung
Nachdem die Erweiterung geladen wurde, vergewissern Sie sich, dass der Server ordnungsgemäß funktioniert. Die Erweiterung stellt automatisch eine Verbindung mit demlocalhost:5555
Wenn Sie einen Remote-Server verwenden, konfigurieren Sie ein Tool wie ngrok (siehe unten). Wenn Sie einen Remote-Server verwenden, müssen Sie ein Tool wie ngrok konfigurieren (siehe unten). - Optional: Fernsteuerung
Um auf einem anderen Gerät oder Claude-Browser zu laufen, richten Sie ngrok für die Portweiterleitung ein:- Installieren Sie ngrok (Beispiel Ubuntu/Debian):
curl -s https://ngrok-agent.s3.amazonaws.com/ngrok.asc | sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | sudo tee /etc/apt/sources.list.d/ngrok.list sudo apt update && sudo apt install ngrok
- Holen Sie sich einen kostenlosen Authtoken für ngrok (besuchen Sie die ngrok-Website, um sich zu registrieren).
- Ngrok ausführen:
ngrok http 5556
- Konfigurieren Sie die erweiterte Remote-Verbindung unter Verwendung der von ngrok bereitgestellten URL.
- Installieren Sie ngrok (Beispiel Ubuntu/Debian):
Hauptfunktionen
- Intelligente Seitenanalyse
Nach der Installation der Erweiterung öffnen Sie eine beliebige Webseite, klicken Sie auf das Erweiterungssymbol, um die Funktion "Seitenanalyse" zu aktivieren. OpenDia extrahiert den Text, die Bilder und andere Inhalte der Webseite zur Verarbeitung durch KI-Modelle (z. B. Claude oder ChatGPT). Die Benutzer können über das MCP-Protokoll Befehle senden, damit die KI den Inhalt analysiert und Ergebnisse zurückliefert. Geben Sie z. B. ein: "Fassen Sie den Kerngedanken dieser Seite zusammen", und die KI wird auf der Grundlage des extrahierten Inhalts eine Zusammenfassung erstellen. - Automatisierung
OpenDia unterstützt die Automatisierung durch KI-Befehle. Wenn Sie zum Beispiel "Suche nach den neuesten KI-Trends auf Twitter" eingeben, öffnet die Erweiterung automatisch Twitter, gibt den Suchbegriff ein und zeigt die Ergebnisse an. Benutzer können Befehle in die Schnittstelle der Erweiterung eingeben oder über APIs mit lokalen KI-Modellen integrieren. - Dynamische Lesezeichenverwaltung
Wählen Sie "Lesezeichen" in der Erweiterungsschnittstelle, geben Sie Schlüsselwörter (z. B. "Maschinelles Lernen") oder Themen ein, und OpenDia durchsucht den Browserverlauf und listet verwandte Webseiten auf. Es unterstützt den Export von Lesezeichen oder die Erstellung von Berichten, was für die Organisation von Forschungsdaten praktisch ist. - Anpassung des Seitenstils
Öffnen Sie die Styling-Tools der Erweiterung und wählen Sie einen voreingestellten Skin oder ein benutzerdefiniertes CSS, um die Schriftarten, Farben oder das Layout der Webseite anzupassen. Diese Funktion ist ideal, um das Leseerlebnis zu optimieren, z. B. durch Umschalten einer Webseite in den Nachtmodus. - Im Hintergrund mit mehreren Registerkarten arbeiten
OpenDia unterstützt die Verarbeitung von Aufgaben im Hintergrund. Benutzer können mehrere Registerkarten gleichzeitig geöffnet haben und verschiedene Befehle ausführen (z.B. Suche in einer Registerkarte, Ausfüllen eines Formulars in einer anderen). Die Ausführung im Hintergrund stellt sicher, dass die Aufgaben nicht unterbrochen werden.
caveat
- Stellen Sie sicher, dass Node.js und der Server ordnungsgemäß ausgeführt werden, da die Erweiterung sonst keine Verbindung herstellen kann.
- Für den Fernbetrieb ist ein stabiles Netzwerk erforderlich, um Unterbrechungen der Ngrok-Verbindung zu vermeiden.
- Erweiterungen erfordern erweiterte Rechte und können Sicherheitswarnungen des Browsers auslösen, daher sollten Sie das Vertrauen manuell bestätigen.
- Das Projekt ist Open-Source-Software, kein offizieller technischer Support, es wird empfohlen, sich auf die GitHub-Community-Diskussion zu beziehen.
Anwendungsszenario
- akademische Forschung
Forscher können OpenDia verwenden, um schnell akademische Artikel aus ihrem Browserverlauf abzurufen, Schlüsselinformationen zu extrahieren und Zusammenfassungen zu erstellen. Geben Sie beispielsweise "Find machine learning articles read this week" ein, um eine Liste relevanter Webseiten und eine Zusammenfassung ihres Inhalts zu erhalten. - Automatisierte Arbeitsabläufe
Mit OpenDia können Marketingexperten Aktionen in sozialen Medien automatisieren, z. B. das massenhafte Posten von Inhalten oder das Sammeln von Daten. Geben Sie den Befehl "Search LinkedIn for AI-related jobs" ein, um Ihre Suche zu automatisieren und die Ergebnisse zu sammeln. - Personalisieren Sie Ihr Surferlebnis
Mit der Funktion zur Anpassung des Seitenstils können die Benutzer das Lesen von Webseiten optimieren. Dies eignet sich für Benutzer, die lange lesen oder eine kontrastreiche Oberfläche benötigen. - Entwicklung und Prüfung
Entwickler können das MCP-Protokoll von OpenDia nutzen, um benutzerdefinierte KI-Tools zu entwickeln, Browser-Automatisierungsfunktionen zu testen und weitere Integrationsmöglichkeiten zu erkunden.
QA
- Benötigt OpenDia eine Internetverbindung?
Die Kernfunktionen von OpenDia werden lokal ausgeführt und erfordern keine Internetverbindung. Für die Fernsteuerung oder den Zugriff auf Online-Inhalte ist eine Netzwerkunterstützung erforderlich. - Welche KI-Modelle werden unterstützt?
OpenDia unterstützt Claude, ChatGPT und lokales LLM über das MCP-Protokoll, für das der Benutzer das Modell konfigurieren muss. - Ist sie völlig kostenlos?
Ja, OpenDia steht unter der MIT-Lizenz und ist völlig kostenlos. Die Benutzer sind nur für die Hardwarekosten der Laufzeitumgebung verantwortlich. - Wie kann ich das Problem beheben, dass die Erweiterung keine Verbindung zum Server herstellen kann?
Prüfen Sie, ob der Server auflocalhost:5555
Wenn der Port nicht belegt ist, stellen Sie sicher, dass der Port nicht belegt ist. Starten Sie den Server neu oder ändern Sie den Port, um das Problem zu lösen.