Programa de quatro etapas para otimização de custos
O controle de custos escalonado é possível com qualquer LLM no Claude Code:
- Configuração hierárquica do modelo::
- Usar modelos de nível GPT-4 de alto custo somente para a geração de código de núcleo (sonnet)
- Conclusão diária de código (haiku) usando modelos econômicos como o gpt-4o-mini
- Integração do modelo localDocking de modelos de código aberto implantados localmente por meio do parâmetro SMALL_MODEL_API_BASE
- Monitoramento de registrosLOG_REQUEST_BODY: habilite LOG_REQUEST_BODY para registrar o uso real e analisar o espaço de otimização
- comutação dinâmicaAjuste a configuração do .env de acordo com a fase do projeto, use um modelo grande para o período de desenvolvimento e corte um modelo pequeno para o período de manutenção.
Resultados típicos: a estratégia de modelo híbrido reduz os custos em comparação com o uso de uma assinatura do Claude Pro em toda a sua extensão, e também há economia em serviços de nuvem com o processamento de dados confidenciais por meio de um modelo local.
Essa resposta foi extraída do artigoQualquer LLM no código Claude: um agente de código aberto para chamar modelos multilíngues para o código ClaudeO