O WaterCrawl recomenda o uso do Docker para uma implementação rápida. Aqui está o processo de implementação padrão:
- Preparação ambientalVerifique se o Docker e o Docker Compose estão instalados
- Obter códigoClonagem de repositórios via git
git clone https://github.com/watercrawl/watercrawl.git - Ambiente de configuraçãoCopie e edite o arquivo .env para configurar os parâmetros de banco de dados e armazenamento
- Início dos serviços: Implementação
docker compose up -dLançamento de contêineres - Verificar a instalação: Acesso
http://localhostConfirmação do tempo de atividade do serviço
Para a implementação no ambiente de produção, é necessário prestar atenção especial à modificação dos itens de configuração relacionados ao MINIO para garantir que o serviço de armazenamento de arquivos esteja funcionando normalmente. Instruções detalhadas de implementação podem ser encontradas no documento DEPLOYMENT.md do projeto.
Essa resposta foi extraída do artigoWaterCrawl: transformando o conteúdo da Web em dados utilizáveis para grandes modelosO































