Avaliação de inovações metodológicas
O RAGEval usa um sistema de avaliação de três níveis:
1) Camada de qualidade da pesquisaMedição de 5 métricas, como recall, relevância contextual, etc.
2) Gerar camadas de qualidadeAvaliação de 4 dimensões de consistência factual, fluência, etc.
3) Camada de desempenho do sistemaAnálise de métricas de O&M, como latência de resposta, uso de memória, etc.
Principais avanços tecnológicos
- Testes adversáriosR: Robustez do sistema de detecção de dados de interferência de injeção automática 20%
- Ajuste dinâmico do limiteAdapta automaticamente o critério de avaliação ao tipo de tarefa
- análise de atribuiçãoPorcentagem de erros de localização originados na fase de recuperação/geração
Um relatório de avaliação típico contém
- Gráfico de radar tridimensional mostrando as pontuações de cada dimensão
- Árvore de análise de atribuição para casos de erro
- Tabela de diferenças em relação ao modelo de linha de base
- Lista de sugestões de aprimoramento direcionadas (por exemplo, ajuste de chunk_size ou adição de amostras negativas)
Essa resposta foi extraída do artigoUltraRAG: uma solução completa do sistema RAG para simplificar a construção de dados e o ajuste fino do modeloO































