Die Schritte zur Ausführung von OCRmyPDF mit Docker sind wie folgt:
- Stellen Sie sicher, dass Docker installiert ist und läuft:
docker run hello-world
- Ziehen Sie das OCRmyPDF-Bild:
docker pull jbarlow83/ocrmypdf
- Markieren Sie den Spiegel mit einem passenden Namen:
docker tag jbarlow83/ocrmypdf ocrmypdf
- Starten Sie OCRmyPDF, um PDF-Dateien zu verarbeiten:
docker run --rm -v $(pwd):/data ocrmypdf /data/input.pdf /data/output.pdf
Dieser Befehl verarbeitet input.pdf im aktuellen Verzeichnis und gibt es in output.pdf aus.
Der Docker-Ansatz eignet sich besonders für das Szenario, in dem keine lokale Umgebung vorhanden ist, um eine plattformübergreifende Bereitstellung und Nutzung von OCRmyPDF zu erreichen.
Diese Antwort stammt aus dem ArtikelOCRmyPDF: gescanntes PDF in durchsuchbaren Text des Open-Source-ToolsDie