Terminologia Compreensão do programa de aprimoramento
Quando o modelo encontra termos fora da base de conhecimento, ele pode ser tratado em um processo de cinco etapas:
- Captura de prazo: através de
monitor_unanswered.py
Registro de script de solicitações de terminologia desconhecida - Expansão automáticaConfiguração do Azure OpenAI para
gen_synthetic_data.py
Geração automática de explicações terminológicas - alinhamento semântico: Executar
train_synonym.py
Estabelecer o mapeamento da terminologia para o conhecimento existente - validar um circuito fechadoAdicionar novos termos a
pending_review.json
Inventariados após revisão manual - Aprendizagem ativa: Habilitar
active_learning
Padrões para coletar feedback do usuário
Os dados de implementação de uma empresa de tecnologia jurídica mostram que a solução tornou o modelo quatro vezes mais rápido na adaptação à nova terminologia regulatória em vigor, e porsemantic_fallback
O mecanismo aumenta a precisão das respostas para termos não registrados de um palpite aleatório para 72%. Recomenda-se executar uma verificação semanal da integridade do tesauro (check_terminology_coverage
).
Essa resposta foi extraída do artigoKBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandesO