Preparação pré-implantação
É preciso ter certeza de que o anfitrião se reúne:
- Versão do driver da placa de vídeo NVIDIA ≥ 535
- Mecanismo Docker 24.0+
- Pelo menos 16 GB de memória gráfica e 64 GB de RAM
Processo de implementação padronizado
- Obtendo o arquivo de configuração oficial docker-compose.yml
- realizar
docker-compose up --build -dInicie o cluster de contêineres (com WebUI, banco de dados de vetores, serviço de modelo) - Visite http://localhost:8843进入控制台
Pontos de validação da implantação
- aprovar (um projeto de lei ou inspeção etc.)
docker logs ultrarag-webVisualizar registros em tempo real - Verifique o status de cada componente no painel System Health (Integridade do sistema) da WebUI
- Execute o caso de teste de fumaça pré-criado (com 5 consultas padrão)
Recomendações de ajuste em nível de produção
Para recomendações de implementação em nível empresarial:
1) Modificar a porta padrão 8843 para aumentar a segurança
2) Monte o volume de persistência para salvar os dados do modelo (requer cerca de 50 GB de espaço)
3) Configurar o proxy reverso do Nginx para criptografia HTTPS
Essa resposta foi extraída do artigoUltraRAG: uma solução completa do sistema RAG para simplificar a construção de dados e o ajuste fino do modeloO































