Docstrange 提供智能字段提取功能,允许用户指定需要提取的字段名称。例如,在命令行中可使用 --extract-fields 参数(如 docstrange invoice.pdf --output json --extract-fields invoice_number total_amount),或在 Python API 中通过 extract_data 方法的 specified_fields 参数设置。工具会基于 AI 自动识别文档中匹配字段的内容,并返回结构化数据。对于更复杂的场景,还可通过 JSON 模式预定义输出结构(如合同条款字段),确保提取结果符合标准化要求。
本答案来源于文章《Docstrange:从文档和图片提取数据并转换为多种格式的工具》




























