Caminho de realização da tecnologia OCR
O Bob é equipado com um mecanismo OCT (Optical Character Transformer) desenvolvido por ele mesmo, que realiza o reconhecimento de texto por meio de um modelo híbrido de rede neural convolucional e arquitetura Transformer. Seus recursos técnicos incluem: 1) implantação de modelo localizado (pacote off-line de 200 MB); 2) suporte para reconhecimento de conjunto de caracteres CJK, como CJK; 3) função de correção automática de texto. No modo de reconhecimento contínuo, o sistema pode manter uma taxa de quadros de processamento em tempo real de 15 fps e mesclar de forma inteligente várias capturas de tela em um documento completo.
Cenários típicos de aplicativos
Essa função é especialmente adequada para três tipos de cenários de trabalho: 1) tradução de capturas de tela de e-books em idioma estrangeiro; 2) digitalização de documentos em papel; 3) extração em tempo real de legendas de vídeo. As medições mostram que a precisão do reconhecimento de documentos digitalizados em PDF é maior do que a função nativa do sistema para aprimorar o 42%. A operação multitoque exclusiva suporta o acionamento silencioso do OCR com três dedos, os resultados do reconhecimento são automaticamente inseridos no histórico do ciclo da área de transferência, simplificando bastante a aplicação cruzada do processo de fluxo de texto.
Essa resposta foi extraída do artigoBob.O































