O RAGLight usa o Chroma como sua solução padrão de armazenamento de vetores e também oferece suporte a vários modelos de incorporação HuggingFace (por exemplo, all-MiniLM-L6-v2) para vetorização de documentos. Essa combinação garante um desempenho eficiente da pesquisa de similaridade, e os usuários também podem personalizar os caminhos de armazenamento vetorial e os nomes das coleções por meio do VectorStoreConfig. A escolha de um modelo de incorporação de alta qualidade tem um impacto direto na precisão da recuperação, e o design oferece aos usuários a flexibilidade para equilibrar o espaço entre eficiência e precisão.
Essa resposta foi extraída do artigoRAGLight: biblioteca Python de geração de aumento de recuperação leveO