Docstrange提供了两种处理模式来保障数据隐私:
- 本地处理模式:完全在用户本地设备上运行,数据不会上传到云端。需要安装OCR依赖(如Ollama),可通过
--cpu-mode
或--gpu-mode
参数启用,适合处理敏感文档。 - 云端处理模式:虽然需要网络连接,但用户可以获取NanoNets的API密钥来控制访问权限。两种模式都确保了数据处理的安全性。
对于高度敏感的数据,推荐使用本地处理模式,虽然可能需要更强的硬件支持,但能完全避免数据外传。
本答案来源于文章《Docstrange:从文档和图片提取数据并转换为多种格式的工具》