番石榴智能文档识别的安装步骤
番石榴智能文档识别是一款桌面软件,需下载并安装到本地设备。以下是详细安装步骤:
下载软件
软件提供中文和英文版本的安装包,可从百度网盘或 Hugging Face 下载最新版本(v2.1)。下载后,将压缩包解压到本地目录。
安装 Tesseract OCR
软件依赖 Tesseract OCR 引擎进行文字识别:
- Windows:从 Tesseract GitHub 下载安装包并安装。
- Linux:运行命令
sudo apt-get install tesseract-ocr
。 - Mac:运行命令
brew install tesseract
。
运行软件
解压软件包后,双击运行 intelligent_document_recognition.exe(Windows)或对应可执行文件。首次运行会加载 OCR 模型,可能需要几秒钟。软件启动后,选择中文或英文界面。
配置优化
用户可编辑软件根目录的 config.ini 文件,设置默认输出格式或保存路径以提高使用效率。
本答案来源于文章《番石榴智能文档识别:离线文档与表格智能识别工具》