O mecanismo de seleção de modelos da UniAPI é a função principal de seu roteamento inteligente e funciona da seguinte forma:
- Avaliação de indicadoresO sistema rastreia dois indicadores-chave:
- Taxa de sucesso da solicitação de API em 72 horas
- Tempo de resposta do primeiro token (latência do primeiro token)
- seleção dinâmicaQuando uma solicitação for recebida, o sistema selecionará automaticamente o provedor de serviços com o melhor desempenho atual com base em uma avaliação abrangente dos indicadores acima.
- Ajustes em tempo realO algoritmo de seleção atualiza continuamente os dados de avaliação à medida que as chamadas de API são feitas, garantindo que as decisões de roteamento sejam sempre baseadas nas condições mais atualizadas.
- tolerância a falhasQuando um serviço tiver um problema, o mecanismo reduzirá automaticamente sua prioridade para evitar afetar a qualidade geral do serviço.
A vantagem desse mecanismo é:
- Os desenvolvedores não precisam intervir manualmente na seleção de modelos
- O sistema é capaz de se adaptar às mudanças no desempenho dos serviços ao longo do tempo.
- Fornecimento automático de soluções de back-up ideais no caso de flutuações de serviço por parte dos fornecedores
- Particularmente adequado para aplicações que exigem estabilidade e tempo de resposta
Essa resposta foi extraída do artigoUniAPI: gerenciamento unificado sem servidor de encaminhamento de API de modelo grandeO































