本地安装和使用olmOCR处理单个PDF文件的基本步骤如下:
- 環境準備:安装Anaconda并创建虚拟环境(Python 3.11)
conda create -n olmocr python=3.11
conda activate olmocr - コアの依存関係をインストールする:克隆代码库并安装基本依赖
git clone https://github.com/allenai/olmocr.git
cd olmocr
pip install -e . - GPU加速(可选):如需GPU支持,安装sglang和flashinfer
- 处理PDF文件:将PDF放入目录后运行处理命令
python -m olmocr.pipeline ./localworkspace --pdfs tests/gnarly_pdfs/horribleocr.pdf
- 結果を見る:处理结果JSON文件保存在./localworkspace/results目录
注意:建议使用NVIDIA显卡以获得最佳性能,需确保GPU驱动和CUDA版本与依赖兼容。
この答えは記事から得たものである。olmOCR: PDF 文書のテキスト変換、表、数式、手書き内容の認識のサポートについて