As etapas para executar o OCRmyPDF usando o Docker são as seguintes:
- Certifique-se de que o Docker esteja instalado e em execução:
docker run hello-world
- Extraia a imagem do OCRmyPDF:
docker pull jbarlow83/ocrmypdf
- Marque o espelho com um nome conveniente:
docker tag jbarlow83/ocrmypdf ocrmypdf
- Execute o OCRmyPDF para processar arquivos PDF:
docker run --rm -v $(pwd):/data ocrmypdf /data/input.pdf /data/output.pdf
Esse comando processará o arquivo input.pdf no diretório atual e o enviará para o arquivo output.pdf.
A abordagem do Docker é particularmente adequada para o cenário de nenhum ambiente local, alcançando a implantação e o uso do OCRmyPDF em várias plataformas.
Essa resposta foi extraída do artigoOCRmyPDF: PDF digitalizado em texto pesquisável da ferramenta de código abertoO