本地安装和使用olmOCR处理单个PDF文件的基本步骤如下:
- Vorbereitung der Umwelt:安装Anaconda并创建虚拟环境(Python 3.11)
conda create -n olmocr python=3.11
conda activate olmocr - Installation von Kernabhängigkeiten:克隆代码库并安装基本依赖
git clone https://github.com/allenai/olmocr.git
cd olmocr
pip install -e . - GPU加速(可选):如需GPU支持,安装sglang和flashinfer
- 处理PDF文件:将PDF放入目录后运行处理命令
python -m olmocr.pipeline ./localworkspace --pdfs tests/gnarly_pdfs/horribleocr.pdf
- Ergebnisse anzeigen:处理结果JSON文件保存在./localworkspace/results目录
注意:建议使用NVIDIA显卡以获得最佳性能,需确保GPU驱动和CUDA版本与依赖兼容。
Diese Antwort stammt aus dem ArtikelolmOCR: Konvertierung von PDF-Dokumenten in Text, Unterstützung von Tabellen, Formeln und Erkennung handschriftlicher InhalteDie