Posicionamento principal da estrutura ReCall
O ReCall é uma estrutura de código aberto baseada em aprendizagem por reforço, especialmente projetada para o treinamento de LLMs (Large Language Models) para implementar a invocação de ferramentas e a inferência em várias etapas. Seu recurso mais importante é livrar-se completamente da dependência de dados supervisionados, por meio do mecanismo de aprendizagem autônoma para permitir que o modelo domine a capacidade de usar uma combinação de ferramentas complexas.
Três recursos técnicos
- aprendizado não supervisionadoUso da estrutura verl de algoritmos de aprendizagem por reforço para otimizar automaticamente as estratégias de invocação de ferramentas por meio de interações ambientais
- Capacidade do conjunto de ferramentasSuporte à invocação dinâmica de ferramentas básicas, como pesquisa e calculadora, e pode lidar com cenários em que várias ferramentas são usadas em tarefas simultâneas
- abertura e extensibilidadeFornecimento de interfaces padronizadas para permitir que os desenvolvedores acessem quaisquer ferramentas personalizadas para formar um sistema de corpo inteligente extensível.
Cenários típicos de aplicativos
Incluindo, mas não se limitando a: Q&A multihop para recuperação de documentos cruzados, geração de relatórios automatizados em nível empresarial, tarefas computacionais complexas em cenários de pesquisa científica e outros cenários inteligentes que exigem colaboração com várias ferramentas.
Essa resposta foi extraída do artigoReCall: treinamento de modelos grandes para inferência de chamadas de ferramentas por meio do aprendizado por reforçoO































