Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como resolver o problema da recuperação eficiente de documentos multimodais (por exemplo, PDF com gráficos)?

2025-08-27 1.4 K

Solução: Aproveitamento da tecnologia de incorporação multimodal da ColPali

Embora os sistemas de recuperação tradicionais geralmente tratem o conteúdo gráfico de forma fragmentada, a tecnologia ColPali do Morphik Core permite a recuperação federada por meio das seguintes etapas:

  • estágio de pré-tratamento: Usoingest_file()Ao importar um arquivo, adicioneuse_colpali=Trueo sistema analisa automaticamente os elementos visuais (diagramas/imagens) no documento com o texto descritivo correspondente para gerar o vetor de incorporação conjunta.
  • estágio de recuperação: Implementaçãoretrieve_chunks()Ao fazer a consulta, o sistema corresponde aos recursos textuais, semânticos e visuais. Por exemplo, uma consulta para "Sales Trend Chart" (gráfico de tendências de vendas) corresponde à descrição textual e reconhece os recursos do gráfico de linhas.
  • Dicas de otimização1) Adicionar a documentos com uso intensivo de imagensmetadata={'content_type':'multimodal'}Elevar a prioridade de processamento 2) PassarkOs parâmetros controlam o número de resultados retornados, equilibrando a precisão e a eficiência.

Os dados experimentais mostram que o método melhora a precisão da recuperação mista de gráficos e textos em 47%, e o tempo de resposta é controlado em 800 ms (tamanho do documento de um milhão de níveis).

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil