A aprendizagem iterativa é obtida por meio de loops de feedback de erro:
- O sistema captura uma exceção quando o agente de execução chama a API e retorna um erro (por exemplo, HTTP 404/500)
- O agente de observação analisa as causas dos erros (por exemplo, parâmetros ausentes/formato incorreto) e gera sugestões de correções
- O agente base adapta a instrução original à recomendação (por exemplo, complementando os campos obrigatórios)
- O agente de execução reinicia a chamada para formar um novo ciclo de execução
Por exemplo, se o parâmetro REQUIRED estiver faltando ao consultar um filme, o sistema aprende que o campo YEAR precisa ser complementado por uma mensagem de erro do TMDB. Esse mecanismo permite que o corpo inteligente domine gradualmente a especificação de uso da ferramenta e, por fim, alcance o aprendizado adaptativo com zero ou poucas amostras.
Essa resposta foi extraída do artigoCoAgents: uma estrutura para aprender a usar ferramentas por meio da colaboração de várias inteligênciasO