search_answer.yamlé o perfil principal que controla o comportamento de recuperação do Medical-RAG e precisa ser ajustado nos cenários a seguir:
Ajuste do efeito de recuperação
- ponderaçãoQuando os resultados de um determinado método de pesquisa (denso/esparso) forem insatisfatórios, modifique o
weight_denseresponder cantandoweight_sparseEstratégia de recuperação de rebalanceamento de parâmetros - Controle quantitativo dos resultados: através de
top_k_denseresponder cantandotop_k_sparseAlterar o número de resultados retornados por cada canal
Adaptação do cenário de negócios
- Otimização de consultas especializadasConfiguração de limites de pesquisa diferenciados para diferentes departamentos (por exemplo, médico/cirúrgico)
- Tratamento de tipos de consultaConfiguração de parâmetros específicos para diferentes tipos de perguntas, como consulta de sintomas, consulta de medicamentos etc.
Requisitos de integração do sistema
- Mudança de modeloQuando se altera o modelo incorporado ou o LLM, ele precisa ser atualizado de forma síncrona
embedding_configConfigurações relacionadas - Ajuste de desempenhoModificado de acordo com os recursos do servidor
batch_sizeOtimização do rendimento por meio de parâmetros como
Não há necessidade de reinserir os dados depois de modificar a configuração; o sistema aplicará automaticamente a nova política na próxima consulta. Recomenda-se passar opython scripts/search_pipline.py --search-configpara executar um teste interativo para verificar o efeito.
Essa resposta foi extraída do artigoMedical-RAG: uma estrutura de geração aumentada por recuperação para a construção de perguntas e respostas médicas chinesasO































