Docstrangeは、2つの方法で特定のフィールドを抽出できるインテリジェントなフィールド抽出機能を提供します:
- Python APIアプローチ使用
extract_data
メソッドでspecified_fields
抽出された請求書番号や合計金額などのパラメータ:fields = result.extract_data(specified_fields=["invoice_number", "total_amount"])
- コマンドライン方式使用
--extract-fields
などのパラメータがある:docstrange invoice.pdf --output json --extract-fields invoice_number total_amount
この機能は特に、請求書や契約書などの文書から重要な情報を素早く抽出し、構造化データ形式にエクスポートするのに適しています。
この答えは記事から得たものである。Docstrange: ドキュメントや画像からデータを抽出し、複数のフォーマットに変換するツール。について