Técnicas de recuperação de conhecimento multimodal
O mecanismo de perguntas e respostas do Universal Xiaoin rompe as limitações da recuperação de texto tradicional e constrói uma trindade de sistema de interação inteligente: o questionamento de texto suporta mais de 5.000 palavras de descrições de problemas complexos; o módulo de reconhecimento de imagem é capaz de analisar 15 tipos de arquivos, como gráficos acadêmicos, anotações manuscritas etc.; e a interação por voz adota um modelo ASR de ponta a ponta, com uma precisão de reconhecimento de dialeto de 92%. O sistema é executado primeiro criando um índice vetorial da base de conhecimento do usuário, depois localizando as passagens mais relevantes por meio de técnicas de pesquisa híbrida (BM25 + pesquisa densa) e, por fim, gerando respostas estruturadas usando o modelo T5.
No teste real, depois de carregar 300 páginas de livros de medicina, o usuário pode retornar respostas profissionais contendo critérios de diagnóstico e pontos de identificação em 8 segundos para perguntas sobre os principais pontos de leitura de imagens de TC; quando um profissional da área jurídica insere uma consulta de voz sobre as condições de cancelamento de contratos de trabalho, o sistema se correlaciona automaticamente com os documentos jurídicos carregados e marca os artigos jurídicos relevantes. Essa função é especialmente adequada para médicos, advogados e outros grupos profissionais que precisam extrair conhecimento profissional rapidamente.
Essa resposta foi extraída do artigoUniversal Little in: um assistente de escrita e aprendizado de IA baseado em uma base de conhecimentoO































