Definição do núcleo do KBLaM
O KBLaM (Knowledge Base augmented Language Model) é um modelo de linguagem aumentada desenvolvido pela MicrosoftFerramentas de aprimoramento da base de conhecimento de código abertoO modelo de atenção é um modelo de atenção que transforma o conhecimento externo em vetores e os incorpora na camada de atenção do modelo maior, permitindo que o modelo utilize diretamente esse conhecimento para questionamento e raciocínio.
Diferenças essenciais em relação ao ajuste fino tradicional
- Diferentes escopos de modificaçãoKBLaM treina apenas o conhecimento de incorporação de adaptador leve sem alterar os parâmetros do modelo subjacente; o ajuste fino tradicional exige o retreinamento de todo o modelo
- Mecanismos de atualização de conhecimentoSuporte para atualização dinâmica da base de conhecimento (custeio linear), enquanto os modelos ajustados não têm flexibilidade para absorver novos conhecimentos.
- eficiência computacionalCustos: os custos aumentam linearmente (O(n)) quando a base de conhecimento é expandida, muito menos do que o aumento em escala quadrada necessário para o ajuste fino (O(n²))
avanço tecnológico
adoçãoMecanismo de atenção retangularO "aprimoramento não destrutivo" da implementação da injeção de conhecimento, que mantém os recursos de processamento de texto do modelo original e acrescenta novas funções de invocação de conhecimento, é a maior inovação em seu projeto arquitetônico.
Essa resposta foi extraída do artigoKBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandesO