O SiteMCP fornece vários parâmetros utilitários para otimizar o processo de rastreamento:
- Controle simultâneo::
--concurrencyparâmetros (por exemplo--concurrency 10) pode aumentar o número de páginas rastreadas ao mesmo tempo - correspondência de caminhos::
-m/--matchsuporta correspondência de curinga para caminhos de URL específicos (por exemplo-m "/blog/**"(Somente a parte do blog é capturada) - Seletor de conteúdo::
--content-selectorPegue áreas específicas com precisão por meio de seletores CSS (por exemplo--content-selector ".content") - Gerenciamento de cache::
--cache-dirPersonalização do caminho do cache.--no-cacheDesativar o cache
Esses parâmetros podem ser usados em combinação, por exemplo:npx sitemcp https://example.com --concurrency 5 -m "/docs/**" --content-selector "#main"
Esse pedido será:
- Rastrear a seção do documento com 5 concorrentes
- Extrai apenas o conteúdo do elemento #main
- Uso das configurações de cache padrão
Essa resposta foi extraída do artigoSiteMCP: rastrear o conteúdo do site e transformá-lo em serviços MCPO































