Die Schritte zur Installation und Verwendung von Docstrange sind unten aufgeführt:
- Stellen Sie sicher, dass Python 3.8 oder höher installiert ist
- Installieren Sie die Docstrange-Bibliothek über pip:
pip install docstrange
- Wählen Sie den Verarbeitungsmodus:
- Cloud-Modus (Standard): keine zusätzliche Konfiguration erforderlich, aber Sie können NanoNets registrieren, um einen API-Schlüssel zu erhalten, um das Limit zu erhöhen
- Nativer Modus: OCR-Abhängigkeiten (z. B. Ollama) müssen installiert werden, verwenden Sie die
--cpu-mode
vielleicht--gpu-mode
Parameter
- Arbeiten Sie mit Dokumenten über die Python-API oder die Befehlszeile
Zum Beispiel der grundlegende Befehl PDF zu Markdown:docstrange document.pdf --output markdown
Eine genauere Beschreibung der Verwendung finden Sie in der GitHub-Dokumentation.
Diese Antwort stammt aus dem ArtikelDocstrange: ein Tool zum Extrahieren von Daten aus Dokumenten und Bildern und deren Konvertierung in verschiedene FormateDie