OCRFlux wird mit Hilfe von Docker-Containern bereitgestellt, und der Installations- und Laufzeitprozess ist in die folgenden Hauptschritte unterteilt:
- Vorbereitung der UmweltZuerst müssen Sie die Docker-Umgebung installieren. Sie können die Docker-Website besuchen, um das entsprechende Installationspaket für das Betriebssystem herunterzuladen.
- Anschaffung eines SpiegelsAusführen
docker pull chatdoc/ocrflux:latest
Ziehen Sie die neuesten Spiegel - Verzeichnis-KonfigurationErstellen Sie drei lokale Arbeitsverzeichnisse zum Speichern von Modelldateien, Eingabe-PDFs und Ausgaben.
- Laufende ContainerGPU-Beschleunigung: Verwenden Sie den Parameter GPU-Beschleunigung (
--gpus all
) des Befehls docker run, um die Konvertierungsaufgabe zu starten
Besondere Aufmerksamkeit:
- Die Modelldateien müssen separat aus dem GitHub-Repository heruntergeladen werden.
- Wenn es keine GPU-Unterstützung gibt, kann der Parameter -gpus entfernt werden, aber die Verarbeitungsgeschwindigkeit wird reduziert
- Es wird empfohlen, dass die PDF-Eingabeauflösung höher als 300DPI ist, um die Erkennungsqualität zu gewährleisten.
Diese Antwort stammt aus dem ArtikelOCRFlux: Leichtes Tool zur Konvertierung von PDFs und Bildern in MarkdownDie