O mapeamento de modelos é a inovação central do Claude Proxy, e sua necessidade é principalmente:
- Requisitos de harmonização de nomesRegras de nomenclatura de modelos variam amplamente entre os fornecedores de IA (por exemplo, Haiku/Sonnet da Claude vs. gpt-3.5 da OpenAI), o front-end mapeado pode ser chamado com um nome uniforme
- Otimização de custos: A qualquer momento, modificando o
OPEN_MODELMudança de variáveis entre modelos em diferentes faixas de preço (por exemplo, Claude-Sonnet para ambiente de produção, mudança para Haiku de custo mais baixo para testes)
Os cenários típicos de aplicação incluem:
- O desenvolvimento de aplicativos corporativos exige o downgrade automático para modelos mais econômicos com base no QPS
- Teste A/B do desempenho de diferentes modelos em tarefas específicas sem modificar o código do cliente
- Alterne rapidamente para um modelo de espera para garantir a continuidade do serviço quando um modelo de API específico falhar.
Esse recurso permite o roteamento dinâmico por meio de modificações simples de variáveis, reduzindo a quantidade de código de adaptação em cerca de 701 TP3T em comparação com as soluções tradicionais.
Essa resposta foi extraída do artigoProxy do Claude: ferramenta de proxy para converter a API do Claude para o formato OpenAIO































