O aprimoramento da qualidade da recuperação do RAGLight pode ser obtido por meio de três dimensões:
- parametrização: Ampliação
k(por exemplo, definido como 8-10) pode recuperar mais fragmentos de documentos, mas aumentará o tempo de computação. Recomenda-se começar com k=5 para testar passo a passo - Seleção de modo::
- começar a usar
RAT模式aprovar (um projeto de lei ou inspeção etc.)reflectionParâmetros (valores recomendados 2-3) adicionar etapas de reflexão para melhorar o rigor lógico - adoção
Agentic RAG(usado em uma expressão nominal)max_stepsOs parâmetros permitem a otimização da pesquisa em várias rodadas
- começar a usar
- Modelos de incorporação: substitui o modelo de vetor padrão por
all-MiniLM-L6-v2Opções de alta qualidade, comoVectorStoreConfigespecificado emembedding_modelresponder cantandoprovider=Settings.HUGGINGFACE
Observação: a seleção do modelo deve levar em conta o desempenho do hardware; modelos incorporados grandes podem aumentar significativamente o consumo de memória.
Essa resposta foi extraída do artigoRAGLight: biblioteca Python de geração de aumento de recuperação leveO































