O dsRAG usa uma arquitetura de microkernel e oferece três tipos principais de componentes plugáveis:
Suporte ao módulo principal
- banco de dados de vetoresBasicVectorDB/WeaviateVectorDB/ChromaDB, etc.
- Modelos de incorporaçãoOpenAI/Cohere/Jina e outras APIs importantes
- reordenadorCohereReranker/VoyageReranker ou Disabled (NoReranker)
Vantagem do design
- Flexibilidade da pilha de tecnologiaAs empresas podem seguir a infraestrutura existente
- controle de custosEscolha serviços de API com preços diferentes, de acordo com seu orçamento
- Ajuste de desempenhoCombinação de programas ideais para diferentes tipos de documentos (por exemplo, documentos jurídicos são adequados para a combinação Cohere+Weaviate)
Exemplos práticos mostram que, ao configurar os componentes de forma racional:
- Aumento da velocidade de processamento da literatura de patentes do 60%
- Maior precisão na recuperação de relatórios financeiros 22%
O sistema também reserva interfaces personalizadas para dar suporte ao acesso do usuário a modelos ou bancos de dados privatizados.
Essa resposta foi extraída do artigodsRAG: um mecanismo de recuperação para dados não estruturados e consultas complexasO































