O DeepSieve é uma estrutura RAG (Retrieval Augmentation Generation) de código aberto desenvolvida por MinghoKwok e hospedada no GitHub, cuja funcionalidade principal é processar com eficiência consultas complexas que exigem raciocínio em várias etapas. A estrutura oferece suporte ao processamento de dados estruturados (tabelas SQL, logs JSON) e não estruturados (Wikipedia) por meio de um design modular e é adequada para cenários de pesquisa acadêmica e análise de negócios. O projeto adota um fluxo de trabalho de quatro etapas de consulta decomposta, roteamento inteligente, mecanismo de reflexão e fusão de respostas, em que o mecanismo de reflexão suporta até duas tentativas automáticas para garantir a precisão da recuperação. Os usuários podem ativar ou desativar os módulos de função de forma flexível por meio da linha de comando. A pré-impressão do arXiv e o corpus completo foram lançados em julho de 2025.
Essa resposta foi extraída do artigoDeepSieve: uma ferramenta de triagem de informações inteligentes RAG para processar fontes de consulta complexasO