Soluções em nível de arquitetura
O módulo MemCube do MemOS permite a otimização da inferência multihop por meio de um design de armazenamento hierárquico:
- estrutura de memória de três níveis::
- Memória de trabalho: dados ativos para chamadas de alta frequência (gerenciamento do algoritmo LRU)
- Memória de cena: Base de conhecimento associativa por tópico
- Memória de longo prazo: dados históricos armazenados e compactados
- Configuração no mundo real: em
config/memcube.yaml
Situado em:layer_weights:
working: 0.6
scenario: 0.3
longterm: 0.1 - Monitoramento de desempenhoUse a ferramenta de análise integrada para visualizar as correlações de contagem de saltos:
python -m memos.analyzer --task=multihop --log_level=debug
caso típicoAo lidar com uma consulta como "Compare as vantagens e desvantagens da tecnologia A e da tecnologia B", que exige raciocínio em várias camadas, o sistema extrai automaticamente os documentos técnicos da camada de memória de cenário e, ao mesmo tempo, obtém os registros de discussões recentes da camada de memória de trabalho.
Essa resposta foi extraída do artigoMemOS: um sistema de código aberto para aprimorar a capacidade de memória de modelos de idiomas grandesO