Princípios da tecnologia de dispersão física
O OntoCast resolve o problema da polissemia e das referências entre documentos por meio da modelagem contextual: quando o mesmo nome de entidade (por exemplo, "Apple") aparece em contextos diferentes, o sistema o classifica automaticamente na categoria correta (empresa de tecnologia ou fruta) com base em recursos semânticos.
Mecanismo de realização
- Análise de correlação entre blocosCrie um mapa de referências de entidades para diferentes blocos de texto em um documento.
- restrição ontológicaValidação semântica usando sistemas de tipos de ontologia predefinidos ou gerados automaticamente
- similaridade de vetoresCalcular a similaridade contextual de referências de entidades por meio de um modelo de incorporação
Cenários típicos de aplicativos
Ao lidar com artigos acadêmicos: 1) distinguir nomes de genes de termos comuns; 2) mesclar as diferentes formas de ortografia dos autores; e 3) correlacionar dados gráficos com descrições no texto. Os testes mostram que ele pode melhorar a precisão da vinculação de entidades em gráficos de conhecimento em mais de 40%.
Essa resposta foi extraída do artigoOntoCast: uma estrutura inteligente para extrair triplas semânticas de documentosO































