A Docstrange oferece uma solução completa de processamento local para segurança de dados:
- Adicione dependências nativas de OCR, como o Ollama, durante a instalação:
pip install ollama - Ativar o modo de processamento local da CPU:
Linha de comando:docstrange financial.pdf --cpu-mode
API do Python:extractor = DocumentExtractor(cpu=True) - Suporta aceleração de GPU (ambiente CUDA necessário):
docstrange financial.pdf --gpu-mode - O processamento é feito inteiramente localmente e o conteúdo do documento não é carregado em nenhum servidor em nuvem
- Recomenda-se que o arquivo de saída também seja armazenado criptografado
O método foi validado para segurança de dados por várias instituições financeiras e é adequado para o manuseio de documentos financeiros confidenciais, como extratos bancários.
Essa resposta foi extraída do artigoDocstrange: uma ferramenta para extrair dados de documentos e imagens e convertê-los em vários formatosO




























