Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

SiteMCP有哪些提高抓取效率的参数选项?

2025-08-25 1.2 K

SiteMCP提供了多个实用参数来优化抓取过程:

  • 并发控制::--concurrencyParameter (z.B.--concurrency 10)可提高同时抓取的页面数
  • 路径匹配::-m/--match参数支持通配符匹配特定URL路径(如-m "/blog/**"只抓取博客部分)
  • 内容选择器::--content-selector通过CSS选择器精准抓取特定区域(如--content-selector ".content")
  • 缓存管理::--cache-dir自定义缓存路径,--no-cache禁用缓存

这些参数可以组合使用,例如:
npx sitemcp https://example.com --concurrency 5 -m "/docs/**" --content-selector "#main"
这条命令会:

  1. 以5个并发抓取文档部分
  2. 只提取#main元素内的内容
  3. 使用默认缓存设置

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch