A recuperação de códigos para documentação técnica requer um tratamento especial:
- Pré-processamento de documentos::
- Certifique-se de que os blocos de código estejam claramente identificados no PDF/TXT (por exemplo, "`wrapped')
- Manter um formato de comentário de código disciplinado nos repositórios do GitHub
- Configuração do pipeline::
- fazer uso de
AgenticRAGPipeline
e configurarmax_steps=3
Implementação de várias rodadas de correspondência de contexto - inferior
k=3
para melhorar a precisão da recuperação de trechos de código
- fazer uso de
- Otimização de consultas::
- A pergunta de entrada contém um nome/argumento de função específico (por exemplo
"pipeline.generate()的使用示例"
) - Modelos de prompt predefinidos para consultas de alta frequência para enfatizar as saídas de código
- A pergunta de entrada contém um nome/argumento de função específico (por exemplo
As medições empíricas mostram que a combinação dellama3
e um parâmetro de temperatura de 0,8 permite mais certeza nos resultados da geração de código.
Essa resposta foi extraída do artigoRAGLight: biblioteca Python de geração de aumento de recuperação leveO