Soluções de otimização de desempenho
As otimizações a seguir são fornecidas para problemas de desempenho que podem ser encontrados ao executar o DeepAgents localmente:
- Otimização da seleção de modelosPreferir modelos com contagem moderada de parâmetros (por exemplo, gpt-oss com parâmetros 7B) para equilibrar precisão e desempenho
- Recomendações de configuração de hardwarePelo menos 16 GB de RAM, com aceleração de GPU para melhorar drasticamente a capacidade de resposta.
- Ajuste de processamento paraleloModifique o parâmetro max_workers em config.yml para controlar o número de subinteligências simultâneas (recomenda-se de 4 a 6 threads)
Operações específicas:
- Selecione a versão light do modelo no ollama pull (adicione o sufixo :7b)
- Iniciar a tarefa de análise somente após encerrar outros programas que consomem muitos recursos
- As subinteligências não essenciais podem ser desativadas para análises simples (modifique a configuração do agent_dispatcher.py)
Alternativa: se o desempenho do equipamento for insuficiente, considere a implantação de um servidor em nuvem com acesso local por meio do mapeamento de portas.
Essa resposta foi extraída do artigoDeepAgents: uma inteligência de IA para pesquisa de ações de nível profissionalO