PP-TableMagic快速使用指南
通过PaddleX提供的API,开发者可以快速实现表格识别功能:
Preparação ambiental
- 安装PaddlePaddle 3.0.0rc0(根据需求选择CPU/GPU版本)
- 安装PaddleX Wheel包:
pip install https://paddle-model-ecology.bj.bcebos.com/paddlex/whl/paddlex-3.0.0rc0-py3-none-any.whl
método de linha de comando
执行以下命令即可完成识别:paddlex --pipeline table_recognition_v2 --input 表格图片.jpg --save_path ./output --device gpu:0
Abordagem da API Python
典型使用流程包含:
- 创建处理管线:
pipeline = create_pipeline("table_recognition_v2")
- 执行预测:
output = pipeline.predict(input="图片路径")
- 保存结果:支持HTML、Excel、JSON等多种格式导出
注意:首次运行会自动下载预训练模型权重(约800MB)。输出结果会包含表格结构、单元格内容和位置等完整信息。
Essa resposta foi extraída do artigoFlying Paddle PP-TableMagic: extração de informações estruturadas para tabelas complexasO