Técnicas de filtragem para lidar com a redundância do contexto RAG
Ragasrelevância do contextoAs métricas são usadas especificamente para medir a relação sinal-ruído:
- Diagnóstico do problema:O grau de redundância foi identificado pelo cálculo da porcentagem de frases essenciais, com uma pontuação de 0 indicando completamente irrelevante e 1 indicando completamente relevante
- Solução:
- Fase de recuperação:Adicionar filtragem de limite de similaridade (sugerir manter parágrafos com cosseno > 0,7)
- Pré-processamento:Aplicação de técnicas de compactação de texto para compactar o contexto
- Pós-processamento:Uso de Ragas para identificar frases-chave como restrições de geração
- Ferramentas de implementação:
- Configurar a avaliação ragas.metrics.context_relevancy
- Análise da necessidade de frases em conjunto com o agr_score
- Otimização dos resultados de pesquisa com base em overlap_scores
O método é descrito em detalhes na seção de implementação técnica do artigo e pode melhorar efetivamente a utilização do contexto de 20% ou mais.
Essa resposta foi extraída do artigoRagas: avaliando a precisão do RAG recall QA e a correlação de respostasO































