Die Bereitstellung der Docker-Umgebung für dots.ocr gliedert sich in die folgenden Schritte:
- Klonen Sie das Code-Repository:
git clone https://github.com/rednote-hilab/dots.ocr.git
- Wechseln Sie in das Projektverzeichnis und installieren Sie die Abhängigkeiten:
cd dots.ocr && pip install -e .
- Verwendung offizieller vorgefertigter Images (optional): Wenn Sie Probleme mit der lokalen Installation haben, können Sie das Docker-Image direkt ziehen, um die Umgebung schnell zu starten.
Hinweis: Die Modellgewichte müssen durch dendownload_model.py
Die Skripte werden separat heruntergeladen, und die Namen der Speicherpfad-Ordner sollten keine Punkte enthalten (DotsOCR wird empfohlen). Für Produktionsumgebungen wird empfohlen, die Skripte in Verbindung mit dem vLLM-Framework einzusetzen, um eine optimale Inferenzleistung zu erzielen.
Diese Antwort stammt aus dem Artikeldots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem DokumentenlayoutDie