O ThinkDoc processa PDF, Word, PPT e outros arquivos de formato complexo por meio de uma profunda tecnologia de análise de documentos, extrai dados semânticos e estruturados, como texto, tabelas, imagens etc., e os armazena uniformemente como um depósito de conhecimento multimodal. A plataforma usa um sistema de recuperação de fusão que combina compreensão semântica, correspondência de palavras-chave e raciocínio de gráfico de conhecimento para transformar dados brutos em conhecimento estruturado que pode ser usado diretamente pela IA. Por exemplo, os manuais técnicos carregados são analisados em dados de texto e gráficos rotulados para dar suporte a cenários de aplicativos de IA, como perguntas e respostas inteligentes ou geração de relatórios.
Essa resposta foi extraída do artigoThinkDoc: uma plataforma de base de conhecimento para análise e recuperação inteligentesO