Derzeitige Position:Abb. Anfang " AI-Antworten

如何在本地安装和运行olmOCR处理单个PDF文件？

2025-08-30

1.7 K

本地安装和使用olmOCR处理单个PDF文件的基本步骤如下：

Vorbereitung der Umwelt：安装Anaconda并创建虚拟环境（Python 3.11）
conda create -n olmocr python=3.11 conda activate olmocr
Installation von Kernabhängigkeiten：克隆代码库并安装基本依赖
git clone https://github.com/allenai/olmocr.git cd olmocr pip install -e .
GPU加速（可选）：如需GPU支持，安装sglang和flashinfer
处理PDF文件：将PDF放入目录后运行处理命令
python -m olmocr.pipeline ./localworkspace --pdfs tests/gnarly_pdfs/horribleocr.pdf
Ergebnisse anzeigen：处理结果JSON文件保存在./localworkspace/results目录

注意：建议使用NVIDIA显卡以获得最佳性能，需确保GPU驱动和CUDA版本与依赖兼容。

Schnellabfragestation AI-Tool