Mecanismo principal do KBLaM e valor de código aberto
O KBLaM (Knowledge Base augmented Language Model) foi desenvolvido pela Microsoft, e sua principal inovação está na transformação de bases de conhecimento externas em pares de vetores de valores-chave, que são diretamente incorporados à camada de atenção do modelo de linguagem grande por meio do mecanismo de atenção retangular. Esse projeto arquitetônico permite que o modelo acesse o conhecimento estruturado em tempo real sem depender de módulos de recuperação tradicionais, reduzindo a complexidade do sistema em comparação com as técnicas de geração aumentada de recuperação (RAG). O projeto é totalmente de código aberto no GitHub e contém bibliotecas de código, scripts experimentais e conjuntos de dados, e é destinado a pesquisadores que precisam explorar técnicas de aprimoramento do conhecimento. O recurso de código aberto o torna uma plataforma de referência para o estudo de mecanismos de fusão de conhecimento para modelos grandes, e é particularmente adequado para cenários de pesquisa que precisam verificar o efeito da incorporação de conhecimento em domínios especializados.
Essa resposta foi extraída do artigoKBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandesO