SiteMCPは、クローリングプロセスを最適化するために、いくつかのユーティリティパラメータを提供します:
- コンカレント・コントロール::
--concurrencyパラメーター(例--concurrency 10)は同時にクロールされるページ数を増やすことができる。 - パスマッチング::
-m/--matchパラメーターは、特定のURLパス(例えば-m "/blog/**"(ブログ部分のみキャプチャ) - コンテンツ・セレクター::
--content-selectorCSSセレクタで特定の領域を正確につかむ(例--content-selector ".content") - キャッシュ管理::
--cache-dirキャッシュパスのカスタマイズ--no-cacheキャッシュを無効にする
これらのパラメーターは、例えば組み合わせて使うことができる:npx sitemcp https://example.com --concurrency 5 -m "/docs/**" --content-selector "#main"
この注文は
- 文書セクションを5つの並行処理でクロールする
- #main要素内のコンテンツのみを抽出します。
- デフォルトのキャッシュ設定を使用する
この答えは記事から得たものである。SiteMCP:ウェブサイトのコンテンツをクローリングし、MCPサービスに変えるについて































