Die Schritte zur Ausführung von OCRmyPDF mit Docker sind wie folgt:
- Stellen Sie sicher, dass Docker installiert ist und läuft:
docker run hello-world
- Ziehen Sie das offizielle OCRmyPDF-Bild:
docker pull jbarlow83/ocrmypdf
- (Optional) Markiert den Mirror mit einem passenden Namen:
docker tag jbarlow83/ocrmypdf ocrmypdf
- Starten Sie die OCR-Verarbeitung:
docker run --rm -v $(pwd):/data ocrmypdf /data/input.pdf /data/output.pdf
Dieser Befehl wird:
- Setzen Sie das aktuelle Verzeichnis (
$(pwd)
) wird an den Container der/data
Verzeichnis (auf der Festplatte des Computers) - Verarbeitung von input.pdf-Dateien im aktuellen Verzeichnis
- Ausgabe der Ergebnisse in das aktuelle Verzeichnis output.pdf
- Löscht automatisch temporäre Container nach der Ausführung (
--rm
Parameter)
Der Docker-Ansatz eignet sich besonders für Szenarien, in denen es keine lokale Umgebung gibt oder in denen eine plattformübergreifende Nutzung erforderlich ist.
Diese Antwort stammt aus dem ArtikelOCRmyPDF: gescanntes PDF in durchsuchbaren Text des Open-Source-ToolsDie