Um sistema de proteção de três camadas para um controle de custos bem ajustado
Para resolver o problema do consumo incontrolável de tokens, a plataforma DeepInfra trabalha com os seguintes métodos para gerenciar efetivamente os custos:
- Restrições orçamentárias rígidasLimite de gastos mensais: habilite a função "Monthly Spending Limit" (Limite de gastos mensais) nas configurações da conta (suporta a configuração de dimensão dupla de USD/Token)
- Proteção de nível de solicitação::
1. configurações obrigatóriasmax_tokensParâmetros (recomenda-se não mais do que 512)
2) HabilitaçãoechoO parâmetro contém o número real de tokens consumidos na resposta
3. usarnOs parâmetros controlam o número de resultados múltiplos gerados - sistema de monitoramento e alerta::
1. visualização em tempo real das taxas de consumo de cada modelo por meio do painel
2) Configure o Webhook para acionar um alerta quando o consumo diário exceder o limite.
3. obter regularmente relatórios de uso para análise de custos
Dicas práticas:
- Modelo de escala paramétrica 7B preferível para tarefas de livros didáticos curtos
- Os documentos longos são processados chamando primeiro oPOST /v1/tokenizecusto
- Usado na fase de desenvolvimentodry_run=TrueTeste paramétrico sem faturamento real
Essa resposta foi extraída do artigoDeepInfra Chat: experimentando e invocando vários serviços de bate-papo de modelo grande de código abertoO
































