WaterCrawl推荐使用Docker进行快速部署,以下是标准的部署流程:
- 环境准备:确保已安装Docker和Docker Compose
- 获取代码:通过git克隆仓库
git clone https://github.com/watercrawl/watercrawl.git
- 配置环境:复制并编辑.env文件,配置数据库和存储参数
- 启动服务:执行
docker compose up -d
启动容器 - 验证安装:访问
http://localhost
确认服务正常运行
对于生产环境部署,需要特别注意修改MINIO相关配置项,确保文件存储服务正常运行。详细的部署说明可以参考项目中的DEPLOYMENT.md文档。
本答案来源于文章《WaterCrawl:将网页内容转化为大模型可用的数据》