Para cenários de digitalização de documentos em papel, a ferramenta integra um subsistema de reconhecimento óptico de caracteres (OCR) de alto desempenho que reconhece com precisão o texto impresso em arquivos PDF ou de imagem digitalizados. O mecanismo de OCR é especialmente otimizado para lidar com cenários desafiadores, como texto difuso, fundos complexos, layout de várias colunas etc., e a precisão do reconhecimento atinge o nível dos softwares comerciais. Depois que os usuários marcarem a opção "Translate images in PDF" (Traduzir imagens em PDF), o sistema extrairá automaticamente os elementos de texto das imagens e os traduzirá, incorporando-os, por fim, perfeitamente à estrutura do layout original. Esse recurso facilita muito a digitalização de livros antigos, o processamento de arquivos e outros aplicativos profissionais.
Essa resposta foi extraída do artigoBelin Doc: ferramenta de tradução de documentos com IA ilimitada e gratuitaO