如何安装PDF-Extract-Kit？需要哪些前置条件？

2025-09-05

1.6 K

安装PDF-Extract-Kit主要分为环境准备、依赖安装和模型下载三个步骤：

1. 环境准备：

2. instalação de dependências:

Armazém de Clonagem:git clone https://github.com/opendatalab/PDF-Extract-Kit.git
安装核心依赖（GPU版）：pip install -r requirements.txt
CPU用户需使用requirements-cpu.txt
特殊组件可能需要单独安装，如doclayout-yolo

3. 下载模型权重：

可通过Python脚本自动下载：python scripts/download_models_hf.py
或从Hugging Face手动下载：git clone https://huggingface.co/opendatalab/PDF-Extract-Kit-1.0

安装完成后，建议运行示例脚本验证环境：python pdf_extract.py --pdf assets/examples/example.pdf

Ferramenta de IA da estação de consulta rápida