Docstrange bietet eine intelligente Feldextraktionsfunktion, die bestimmte Felder auf zwei Arten extrahieren kann:
- Python-API-Ansatz: Verwendung
extract_data
Methode und geben Sie diespecified_fields
Parameter, wie z. B. die extrahierte Rechnungsnummer und den Gesamtbetrag:fields = result.extract_data(specified_fields=["invoice_number", "total_amount"])
- Kommandozeilenmethode: Verwendung
--extract-fields
Parameter wie zum Beispiel:docstrange invoice.pdf --output json --extract-fields invoice_number total_amount
Diese Funktion eignet sich besonders für die schnelle Extraktion von Schlüsselinformationen aus Dokumenten wie Rechnungen und Verträgen und deren Export in ein strukturiertes Datenformat.
Diese Antwort stammt aus dem ArtikelDocstrange: ein Tool zum Extrahieren von Daten aus Dokumenten und Bildern und deren Konvertierung in verschiedene FormateDie