使用限制与注意事项
为确保最佳使用效果,需特别注意以下事项:
技术限制
- 文件格式要求:必须是文本型PDF(扫描件图片PDF无法处理)
- 中文支持:虽然支持中文转换,但路径含中文可能报错
- 网络依赖:必须保持网络连接以调用OpenAI API
使用规范
- API密钥安全:不要将密钥硬编码在脚本中,建议通过环境变量传入
- 大文件处理:超过50页的文档建议分批次转换
- 结果验证:首次转换后应检查数学公式等特殊内容的准确性
常见问题解决方案
问题现象 | 排查步骤 |
---|---|
转换结果乱码 | 检查PDF是否加密或包含特殊字体 |
表格识别错位 | 尝试调整main.py中的表格检测参数 |
API调用失败 | 确认密钥有效性和余额状态 |
遇到持续性问题时,建议到GitHub项目页提交issue并提供测试用例。
本答案来源于文章《MarkPDFDown:基于多模态模型将PDF转为Markdown文件》