Daten-Caching und Lebenszyklus-Management
SiteMCP hat eine komplette Cache-Management-Lösung entwickelt, um ein Gleichgewicht zwischen Datenfrische und Zugriffseffizienz herzustellen:
- LagerungsstrategieDie Standardeinstellung ist die Verwendung von
~/.cache/sitemcpKatalog, der die Verwendung des--cache-dirMaßgeschneiderte Pfade - Cache-Steuerung: Vorausgesetzt
--no-cacheOption zur Deaktivierung der Zwischenspeicherung bei Ad-hoc-Datenbedarf - AktualisierungsmechanismusWiederholtes Crawlen der gleichen URL löst automatische Cache-Updates aus, um die Aktualität der Daten zu gewährleisten.
Die zwischengespeicherten Dateien werden mit Hilfe der gzip-Komprimierung gespeichert, die im Durchschnitt nur 15-30 KB Platz pro Seite beansprucht. Für große Dokumentenseiten (z.B. offizielle Vite-Dokumente) empfiehlt es sich, regelmäßig dierm -rf ~/.cache/sitemcpBereinigung veralteter Daten. Dieses System ermöglicht es dem KI-Assistenten, schnell auf historische Daten zuzugreifen und gleichzeitig Zugang zu neuen Inhalten zu erhalten.
Diese Antwort stammt aus dem ArtikelSiteMCP: Crawling von Website-Inhalten und deren Umwandlung in MCP-DiensteDie































