Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como usar o OCRmyPDF para processar documentos PDF contendo vários idiomas?

2025-08-14 160

Ao lidar com documentos PDF multilíngues, você precisa usar-lespecifica a combinação de códigos de idioma:

  • Formato de comando básico:
    ocrmypdf -l 语言代码1+语言代码2 input.pdf output.pdf
  • Por exemplo, lidar com documentos mistos em chinês e inglês:
    ocrmypdf -l eng+chi_sim input.pdf output.pdf

Advertências:

  1. Os pacotes de idiomas correspondentes do Tesseract devem ser instalados com antecedência; por exemplo, para o chinês, você precisa instalar o pacotetesseract-ocr-chi-sim
  2. O código da linguagem pode ser encontrado na documentação do Tesseract.
  3. Uso recomendado--verbose 2Resultados da identificação da validação de parâmetros
  4. Para documentos de layout complexos, talvez seja necessário ajustar os parâmetros ou usar plug-ins.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil