Uma abordagem em três etapas para melhorar o desperdício de recursos de pesquisa:
- Alerta antecipado de orçamento: Configurações
mode: 'throw'
e orçamentos iniciais mais baixos (por exemplo, US$ 10) - ajuste dinâmico: através de
guard.setLimit()
Expansão flexível da capacidade de acordo com a fase experimental - análise de registros: Uso
guard.getLogs()
Identificar chamadas de API de alto consumo
Em testes reais no domínio da educação, a solução reduz o desperdício experimental em 651 TP3T em média, o que é particularmente adequado para tarefas de treinamento de modelos de longa duração.
Essa resposta foi extraída do artigoAgentGuard: uma ferramenta para monitorar os custos dos agentes de IA em tempo real e evitar excessos de custosO