O aprimoramento da qualidade da recuperação do RAGLight pode ser obtido por meio de três dimensões:
- parametrização: Ampliação
k
(por exemplo, definido como 8-10) pode recuperar mais fragmentos de documentos, mas aumentará o tempo de computação. Recomenda-se começar com k=5 para testar passo a passo - Seleção de modo::
- começar a usar
RAT模式
aprovar (um projeto de lei ou inspeção etc.)reflection
Parâmetros (valores recomendados 2-3) adicionar etapas de reflexão para melhorar o rigor lógico - adoção
Agentic RAG
(usado em uma expressão nominal)max_steps
Os parâmetros permitem a otimização da pesquisa em várias rodadas
- começar a usar
- Modelos de incorporação: substitui o modelo de vetor padrão por
all-MiniLM-L6-v2
Opções de alta qualidade, comoVectorStoreConfig
especificado emembedding_model
responder cantandoprovider=Settings.HUGGINGFACE
Observação: a seleção do modelo deve levar em conta o desempenho do hardware; modelos incorporados grandes podem aumentar significativamente o consumo de memória.
Essa resposta foi extraída do artigoRAGLight: biblioteca Python de geração de aumento de recuperação leveO