WaterCrawlは、迅速なデプロイのためにDockerを使用することを推奨しており、ここに標準的なデプロイプロセスを示します:
- 環境準備DockerとDocker Composeがインストールされていることを確認する。
- コードを取得gitによるリポジトリのクローン
git clone https://github.com/watercrawl/watercrawl.git - 設定環境.envファイルをコピーして編集し、データベースとストレージのパラメーターを設定する。
- サービス開始実施
docker compose up -d打ち上げコンテナ - インストールの確認アクセス
http://localhostサービス稼働時間の確認
本番環境へのデプロイでは、ファイル・ストレージ・サービスが正常に実行されるように、MINIO関連の設定項目の変更に特別な注意を払う必要があります。詳細なデプロイ手順は、プロジェクト内のDEPLOYMENT.mdドキュメントを参照してください。
この答えは記事から得たものである。WaterCrawl:ウェブコンテンツを大規模モデルで使用可能なデータに変換について































