Programa de implantação padronizado
O UltraRAG oferece duas opções de implementação confiáveis:
- Implantação em contêineres do Docker::
- Todas as dependências são pré-instaladas
- Suporta aceleração de GPU (requer o tempo de execução do NVIDIA Docker)
- Mecanismo integrado de verificação de integridade
- Implantação do ambiente Conda::
- Fornece controle de versão preciso dos pacotes Python
- Adequado para desenvolvimento e depuração locais
- Suporta a atualização a quente de modelos
Processo de implantação detalhado
Programa Docker:
- Certifique-se de que o host instale o Docker 20.10+ e os drivers NVIDIA
- realizar
docker-compose up --build -d - entrevistas
http://localhost:8843
Programa Conda:
- Criar um ambiente:
conda create -n ultrarag python=3.10 - Ativar o ambiente:
conda activate ultrarag - Instale a dependência:
pip install -r requirements.txt
Recomendações de operação e manutenção
Recomenda-se que os ambientes de produção sejam agrupados em clusters e implantados com o Docker Swarm ou o Kubernetes, e que o sistema seja pré-configurado com a interface de monitoramento do Prometheus (porta padrão 9090).
Essa resposta foi extraída do artigoUltraRAG: uma solução completa do sistema RAG para simplificar a construção de dados e o ajuste fino do modeloO































