Três maneiras de melhorar a eficiência do rastreamento em sites grandes
As estratégias de otimização a seguir podem ser usadas para sites grandes:
- Controle simultâneo: Uso
--concurrency 10aumenta o número de grabs paralelos (o valor padrão é menor), reduzindo significativamente o tempo total - Filtragem de caminhos: através de
-mpara especificar o caminho crítico (por exemplo-m "/docs/**") para evitar o rastreamento de páginas irrelevantes - extração de conteúdo: Cooperação
--content-selectorOs parâmetros extraem com precisão a área-alvo, reduzindo a quantidade de processamento de dados
Exemplo prático:npx sitemcp https://large-site.com --concurrency 15 -m "/api/**" --content-selector "#main-content"
Esse comando grava o módulo de conteúdo especificado na área de documentação da API com alto desempenho.
Essa resposta foi extraída do artigoSiteMCP: rastrear o conteúdo do site e transformá-lo em serviços MCPO




























