Windows环境配置避坑指南
针对Windows特有的环境问题,推荐以下解决方案:
- 替代安装方案:当直接pip失败时,按顺序手动安装:
1. 先安装vc_redist.x64.exe运行库
2. conda install -c conda-forge poppler
3. pip install paddlepaddle==2.5.1 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html - 路径处理:所有文件路径需转为Windows格式,例如:
pdf_path: “C:\Users\test\doc.pdf” # 双反斜杠或原始字符串 - 显存优化:在低配GPU设备上,修改model_configs.yaml:
device: “cuda” → “cpu”
batch_size: 8 # 降低批处理量
诊断建议:出现cv2等导入错误时,优先检查Python环境是否为3.10,32位系统需使用特制wheel包。
本答案来源于文章《PDF-Extract-Kit:提取复杂结构PDF内容的开源工具》