如何在本地安装和运行olmOCR处理单个PDF文件？

2025-08-30

1.7 K

本地安装和使用olmOCR处理单个PDF文件的基本步骤如下：

環境準備：安装Anaconda并创建虚拟环境（Python 3.11）
conda create -n olmocr python=3.11 conda activate olmocr
コアの依存関係をインストールする：克隆代码库并安装基本依赖
git clone https://github.com/allenai/olmocr.git cd olmocr pip install -e .
GPU加速（可选）：如需GPU支持，安装sglang和flashinfer
处理PDF文件：将PDF放入目录后运行处理命令
python -m olmocr.pipeline ./localworkspace --pdfs tests/gnarly_pdfs/horribleocr.pdf
結果を見る：处理结果JSON文件保存在./localworkspace/results目录

注意：建议使用NVIDIA显卡以获得最佳性能，需确保GPU驱动和CUDA版本与依赖兼容。

クイック照会ステーションAIツール