São necessárias quatro medidas para reduzir as alucinações em ambientes acadêmicos:
- Ativar o modo RAT: através de
RATPipeline
configurarreasoning_model_name="deepseek-r1:1.5b"
responder cantandoreflection=2
Verificação de fatos aprimorada - Rotulagem de origem: em
RAGPipeline
Definido na inicializaçãoreturn_sources=True
A saída será acompanhada pela localização das referências. - Limpeza de documentosRemoção de conteúdo não textual (por exemplo, cabeçalhos e rodapés) durante o pré-processamento de PDFs para reduzir distrações sonoras.
- ajuste de parâmetros::
- aumentar a escala
k=7
Obter mais material de apoio - Definição dos LLMs
temperature=0.3
Redução da aleatoriedade
- aumentar a escala
Recomenda-se que a amostragem manual das principais descobertas seja implementada e que um mecanismo de avaliação de precisão seja estabelecido para otimização contínua.
Essa resposta foi extraída do artigoRAGLight: biblioteca Python de geração de aumento de recuperação leveO