Atualmente, o VOP tem os seguintes recursos de processamento de idiomas:
Suporte integrado para idiomas
- pacote de idiomas básicoInglês (eng), japonês (jpn), coreano (kor)
- reconhecimento híbrido: através de
--lang eng+jpnParâmetros para o processamento simultâneo de documentos bilíngues
Expansão de novas etapas do idioma
- Instale os pacotes de idiomas do Tesseract correspondentes (por exemplo, chinês:
sudo apt install tesseract-ocr-chi-sim) - compilador
config/languages.jsonAdicionar um item de configuração:"chi": {
"tesseract_code": "chi_sim",
"google_vision_code": "zh"
} - Reinicie o programa e especifique o parâmetro de idioma:
--lang chi+eng
Advertências:
- Novos idiomas precisam ser testados quanto à precisão do reconhecimento, e documentos com layout complexo podem exigir o ajuste dos parâmetros do modelo YOLO.
- Idiomas não latinos (por exemplo, árabe) exigem configuração adicional para a detecção da direção do texto
- Recomenda-se usar preferencialmente a API do Google Vision (com suporte para mais de 200 idiomas), mas a precisão do reconhecimento de fórmulas/tabelas pode ser reduzida
Essa resposta foi extraída do artigoVOP: ferramenta de OCR para extração de diagramas complexos e fórmulas matemáticasO
































