Há quatro etapas principais que precisam ser concluídas para usar o dsRAG:
Preparação ambiental
- aprovar (um projeto de lei ou inspeção etc.)
pip install dsragInstalação de pacotes Python - Prepare a chave de API (por exemplo, OpenAI/Cohere) e defina-a como uma variável de ambiente
Importação de documentos
from dsrag.create_kb import create_kb_from_file
file_path = "your_document.pdf"
kb = create_kb_from_file("custom_kb", file_path)
O sistema é compatível com formatos como PDF/Markdown e conclui automaticamente a análise, a fragmentação e a vetorização.
Execução de consultas
from dsrag.knowledge_base import KnowledgeBase
kb = KnowledgeBase("custom_kb")
results = kb.query(["您的查询问题"])
Configuração personalizada (opcional)
Os usuários avançados podem substituir os componentes padrão:
- Bancos de dados vetoriais: Weaviate/Chroma, etc.
- Modelos de incorporação: CohereEmbedding, etc.
- Reordenadores: VoyageReranker, etc.
O sistema persiste automaticamente todas as configurações no disco, eliminando a necessidade de reprocessar documentos para uso posterior.
Essa resposta foi extraída do artigodsRAG: um mecanismo de recuperação para dados não estruturados e consultas complexasO




























