O Docstrange oferece um recurso de extração de campo inteligente que pode extrair campos específicos de duas maneiras:
- Abordagem da API Python: Uso
extract_data
e especifique o métodospecified_fields
parâmetros, como o número da fatura extraída e o valor total:fields = result.extract_data(specified_fields=["invoice_number", "total_amount"])
- método de linha de comando: Uso
--extract-fields
Parâmetros como:docstrange invoice.pdf --output json --extract-fields invoice_number total_amount
Essa função é particularmente adequada para extrair rapidamente informações importantes de documentos, como faturas e contratos, e exportá-las para um formato de dados estruturados.
Essa resposta foi extraída do artigoDocstrange: uma ferramenta para extrair dados de documentos e imagens e convertê-los em vários formatosO