Em resposta ao risco de interrupções imprevisíveis nos serviços de modelo, a nexos.ai oferece um mecanismo de recuperação de desastres em três níveis:
- Monitoramento da saúde em tempo realO sistema detecta o status da API de todos os modelos conectados a cada 30 segundos e avisa com uma bandeira vermelha no console em caso de exceção.
- Função Auto-RetornoGateway Settings (Configurações de gateway): Ative essa função e especifique de 1 a 3 modelos de espera em [Gateway Settings (Configurações de gateway)], e a alternância será concluída em 0,1 segundo em caso de falha (por exemplo, GPT-4→Claude→PaLM).
- Assistência local da Cache(Solução aprimorada): em conjunto com servidores de cache criados pela própria empresa, os serviços básicos de Q&A podem ser fornecidos temporariamente no caso de uma falha global.
Sugestão de implementação: recomenda-se configurar pelo menos dois modelos de reserva de fornecedores diferentes (por exemplo, OpenAI+Anthropic) para as principais linhas de negócios, a fim de evitar o impacto de uma falha em grande escala de um único fornecedor. O desempenho do modelo de reserva é verificado mensalmente por meio do módulo [Benchmarking] para garantir que ele atenda aos requisitos comerciais.
Essa resposta foi extraída do artigonexos.ai: uma plataforma de otimização e gerenciamento de modelos de IA de nível empresarialO





























