Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite

Chrom MCP Server ist eine Chrome-basierte Erweiterung. Sie ermöglicht KI-Assistenten (z. B. Claude) die direkte Steuerung des Chrome-Browsers des Nutzers über das Model Context Protocol (MCP)-Protokoll für komplexe automatisierte Vorgänge, Inhaltsanalyse und semantische Suche. Im Vergleich zu herkömmlichen Browser-Automatisierungstools (z. B. Playwright) muss kein separater Browserprozess gestartet werden, sondern es wird direkt der geöffnete Chrome-Browser des Benutzers verwendet, wobei der Anmeldestatus, die Einstellungen und die Gewohnheiten des Benutzers erhalten bleiben. Sie läuft vollständig nativ, schützt die Privatsphäre des Nutzers, unterstützt Streaming-HTTP-Verbindungen und tab-übergreifende Kontexte und bietet mehr als 20 Dienstprogramme. Die Benutzer müssen die Chrome-Erweiterung installieren undmcp-chrome-bridgeSoftware-Paket. Es wurde von hangwin entwickelt, unterliegt der MIT-Lizenz und ist für Benutzer geeignet, die die Effizienz ihrer Browser mit KI verbessern möchten.

 

Funktionsliste

  • Browser-Automatisierung: unterstützt KI-Assistenten zur Steuerung des Browsers und zur Durchführung von Aktionen wie Klicken, Tippen und Navigieren.
  • Semantische Suche: Integrierte Vektordatenbank zum intelligenten Durchsuchen der Inhalte von Browser-Tabs.
  • Inhaltsanalyse: KI-gesteuerte Textextraktion und Ähnlichkeitsabgleich für schnelles Parsen von Webinformationen.
  • Screenshot-Tool: Unterstützung von Webseiten-Screenshots, optimierte base64-Bildkomprimierung, um Ressourcen zu sparen.
  • Netzwerküberwachung: Echtzeitüberwachung von Netzwerkanfragen und Analyse der Ladeleistung von Webseiten.
  • Erkennung interaktiver Elemente: Verbesserte Werkzeuge zur Erkennung interaktiver Elemente, einschließlich div-Elemente.
  • Erfassung der Konsolenausgabe: überchrome_consoleum die Protokolle der Browser-Konsole abzurufen.
  • Lesezeichen- und Verlaufsverwaltung: Unterstützung von KI zur Bearbeitung von Benutzer-Lesezeichen und des Browserverlaufs.
  • Registerkartenübergreifender Kontext: Ermöglicht die gemeinsame Nutzung und Bearbeitung von Daten über mehrere Registerkarten hinweg.
  • Lokaler Betrieb: Alle Vorgänge werden lokal durchgeführt, um den Datenschutz zu gewährleisten.
  • Streaming-HTTP-Verbindung: ermöglicht eine effiziente Kommunikation mit kurzen Antwortzeiten.
  • SIMD-Beschleunigung: WebAssembly optimiert die Vektorarithmetik für eine 4-8fache Beschleunigung.
  • Skriptinjektion: unterstützt die dynamische Injektion von JavaScript-Skripten zur Erweiterung der Funktionalität.

 

Hilfe verwenden

Einbauverfahren

Um Chrome MCP Server zu verwenden, müssen die Benutzer die folgenden Installationsschritte ausführen. Der gesamte Prozess ist einfach, aber Sie müssen sicherstellen, dass Ihre Umgebung richtig konfiguriert ist.

  1. Überprüfung der Umweltanforderungen
    • Stellen Sie sicher, dass Node.js installiert ist (Version 18.19.0 oder höher).
    • Installieren Sie pnpm oder npm als Paketmanager.
    • Verwenden Sie den Browser Chrome oder Chromium (neueste Version empfohlen).
  2. Chrome-Erweiterung installieren
    • Besuchen Sie die GitHub-Seite für Veröffentlichungen unter https://github.com/hangwin/mcp-chrome/releases.
    • Laden Sie die neueste Version der Chrome-Erweiterung herunter (.crx(Dokumentation).
    • Öffnen Sie Chrome und gehen Sie zuchrome://extensions/.
    • Aktivieren Sie den "Entwicklermodus" (Schalter in der oberen rechten Ecke).
    • Ziehen und Ablegen.crxGehen Sie auf die Seite Erweiterungen und klicken Sie auf "Erweiterung hinzufügen", um die Installation abzuschließen.
  3. Montagemcp-chrome-bridge
    • Öffnen Sie ein Terminal und führen Sie den folgenden Befehl aus, um global zu installierenmcp-chrome-bridge::
      npm install -g mcp-chrome-bridge
      

      Oder verwenden Sie pnpm:

      pnpm install -g mcp-chrome-bridge
      
    • Wenn Sie pnpm v7+ verwenden, ist das Postinstallationsskript standardmäßig deaktiviert; Sie müssen das Skript aktivieren:
      pnpm config set enable-pre-post-scripts true
      
    • Wenn die automatische Registrierung fehlschlägt, registrieren Sie sich manuell:
      mcp-chrome-bridge register
      
  4. Konfigurieren des MCP-Client
    • Ändern Sie die Konfigurationsdatei des MCP-Clients am Beispiel von CherryStudio, um Folgendes hinzuzufügen:
      {
      "mcpServers": {
      "chrome-mcp-server": {
      "type": "streamableHttp",
      "url": "http://127.0.0.1:12306/mcp"
      }
      }
      }
      
    • Wenn der Client nur stdio-Verbindungen unterstützt, müssen Sie überprüfen, ob diemcp-chrome-bridgeInstallationspfad und Konfiguration der stdio-Verbindungsmethode (siehe die offizielle Dokumentation)CONTRIBUTING.md).
  5. Neue Dienste
    • Sobald die Installation abgeschlossen ist, wird die Chrome-Erweiterung automatisch aktiviert.
    • in Bewegung seinmcp-chrome-bridgeum sicherzustellen, dass der Dienst auf derhttp://127.0.0.1:12306/mcp.
    • Ein KI-Assistent (z. B. Claude) kann sich dann über das MCP-Protokoll mit dem Browser verbinden.

Hauptfunktionen

Im Folgenden finden Sie einige Funktionen von Chrome MCP Server und die detaillierte Vorgehensweise.

Browser-Automatisierung

  • Funktionelle BeschreibungDer KI-Assistent kann den Browser über das MCP-Protokoll steuern, um Aktionen wie Klicken, Tippen und Navigieren auszuführen. Zum Beispiel das automatische Ausfüllen von Formularen oder das stapelweise Öffnen von Webseiten.
  • Verfahren::
    1. Vergewissern Sie sich, dass der MCP-Dienst aktiv ist und der KI-Assistent angeschlossen ist.
    2. Geben Sie Befehle in die Oberfläche des KI-Assistenten ein, z. B. "Öffnen Sie Google und suchen Sie nach dem Stichwort 'KI'".
    3. Chrome führt die Aktion automatisch aus, und AI analysiert den Inhalt der Seite und gibt das Ergebnis zurück.
    4. Komplexe Aufgaben wie "Suche nach einem Produkt auf einer E-Commerce-Website und lege es in den Einkaufswagen" können durch Befehle festgelegt werden.

semantische Suche

  • Funktionelle BeschreibungKI kann mithilfe der integrierten Vektordatenbank den Inhalt von Browser-Tabs intelligent durchsuchen, um relevante Informationen schnell zu finden.
  • Verfahren::
    1. Öffnen Sie mehrere Registerkarten, die den zu durchsuchenden Inhalt enthalten.
    2. Geben Sie einen Befehl in den KI-Assistenten ein, z. B. "Suche alle Registerkarten, in denen 'KI-Technologie' erwähnt wird".
    3. Die KI analysiert den Inhalt der Registerkarten und liefert passende Ergebnisse, einschließlich Titel und Zusammenfassungen.
    4. Die KI kann außerdem angewiesen werden, bestimmte Passagen zu extrahieren oder zu relevanten Registerkarten zu springen.

Inhaltsanalyse

  • Funktionelle BeschreibungKI kann Webseitentexte für den Ähnlichkeitsabgleich oder für Zusammenfassungen extrahieren. Zum Beispiel für die Analyse der wichtigsten Punkte eines Nachrichtenartikels.
  • Verfahren::
    1. Öffnen Sie die Ziel-Webseite, z. B. einen Nachrichtenartikel.
    2. Geben Sie Befehle in den KI-Assistenten ein, wie z. B. "Fasse den Hauptinhalt der aktuellen Webseite zusammen".
    3. Die KI extrahiert den Text und erstellt eine knappe Zusammenfassung oder eine Liste von Schlüsselwörtern.
    4. Die KI kann aufgefordert werden, den Inhalt mehrerer Webseiten zu vergleichen, um Gemeinsamkeiten oder Unterschiede festzustellen.

Screenshot-Tools

  • Funktionelle BeschreibungUnterstützung von Webseiten-Screenshots, optimierte base64-Bildkomprimierung zur Reduzierung des Ressourcenverbrauchs.
  • Verfahren::
    1. Öffnen Sie die Webseite, von der Sie einen Screenshot machen möchten.
    2. Eingabe von Befehlen in den KI-Assistenten, z. B. "Vollbild der aktuellen Webseite erfassen".
    3. Die KI erstellt Screenshots und liefert base64-kodierte Bilder.
    4. Das Bild kann gespeichert werden oder die KI kann aufgefordert werden, den Inhalt des Bildes zu analysieren (z. B. Text zu extrahieren).

Netzüberwachung

  • Funktionelle BeschreibungÜberwachen Sie Webanfragen für Seiten in Echtzeit, um die Ladeleistung zu analysieren oder Probleme zu beheben.
  • Verfahren::
    1. Öffnen Sie die Zielseite.
    2. Geben Sie einen Befehl in den KI-Assistenten ein, z. B. "Webanfragen für die aktuelle Webseite überwachen".
    3. Die KI liefert eine Liste von Anfragen, einschließlich URLs, Statuscodes und Antwortzeiten.
    4. Langsam ladende Ressourcen oder ungewöhnliche Anfragen können weiter analysiert werden.

caveat

  • Stellen Sie sicher, dass Chrome-Erweiterungen undmcp-chrome-bridgeVersionskonsistenz zur Vermeidung von Kompatibilitätsproblemen.
  • Die lokale Ausführung kann etwas Speicherplatz beanspruchen, es wird empfohlen, nicht benötigte Registerkarten zu schließen.
  • Besuchen Sie die GitHub-SeiteCONTRIBUTING.mdErhalten Sie weitere Konfigurationsdetails oder tragen Sie Code bei.

 

Anwendungsszenario

  1. automatisierte Büroarbeit
    Mitarbeiter können KI-Assistenten für die Stapelverarbeitung von Webaufgaben einsetzen, z. B. zum automatischen Ausfüllen von Berichten, Extrahieren von Daten oder Überwachen von Website-Updates.Chrome MCP Server nutzt die vorhandene Browserumgebung und spart Zeit, da eine erneute Anmeldung nicht mehr erforderlich ist.
  2. Inhaltliche Recherche
    Forscher können mithilfe von semantischen Such- und Inhaltsanalysefunktionen schnell Informationen aus mehreren Webseiten zusammenstellen. Analysieren Sie zum Beispiel Branchenberichte oder wissenschaftliche Artikel, extrahieren Sie die wichtigsten Punkte und erstellen Sie Zusammenfassungen.
  3. Webentwicklung und -prüfung
    Entwickler können die Netzwerküberwachung und die Erfassung von Konsolenausgaben nutzen, um die Webleistung zu debuggen oder Testinteraktionen zu automatisieren. Tools zur Skriptinjektion unterstützen die dynamische Änderung von Webseiten für einfaches Prototyping.
  4. Persönliche Effizienzverbesserung
    Die Benutzer können die KI Lesezeichen und den Browserverlauf verwalten lassen oder sich wiederholende Aktionen wie die regelmäßige Überprüfung von Postfächern oder das Herunterladen von Dateien in Stapeln durchführen, um die tägliche Effizienz zu steigern.

 

QA

  1. Ist für Chrome MCP Server eine Internetverbindung erforderlich?
    Er läuft vollständig lokal, und die Kommunikation zwischen dem KI-Assistenten und dem Browser erfolgt lokal, ohne dass eine Internetverbindung erforderlich ist. Der KI-Assistent selbst kann jedoch je nach dem verwendeten KI-Modell eine Vernetzung erfordern.
  2. Welche KI-Assistenten werden unterstützt?
    Unterstützt derzeit KI-Assistenten, die mit dem MCP-Protokoll kompatibel sind, wie z. B. Claude. Weitere Modelle können in Zukunft erweitert werden, überprüfen Sie GitHub für Updates.
  3. Wie gewährleisten Sie Datenschutz und Sicherheit?
    Alle Vorgänge werden lokal durchgeführt und die Daten werden nicht in die Cloud hochgeladen. Es wird empfohlen, Erweiterungen vom offiziellen GitHub herunterzuladen, um Quellen Dritter zu vermeiden.
  4. Was ist, wenn die Installation fehlschlägt?
    Überprüfen Sie, ob die Node.js- und pnpm-Versionen kompatibel sind, und stellen Sie sicher, dass der Chrome-Entwicklermodus aktiviert ist. SieheCONTRIBUTING.mdOder senden Sie uns ein Problem für Hilfe.
0Lesezeichen
0Gelobt

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch