O RolmOCR usa uma arquitetura completa de execução off-line que oferece vantagens significativas de segurança em relação aos serviços em nuvem:
- Não há necessidade de enviar dados de documentos confidenciais para evitar o risco de vazamento de privacidade.
- O processo de operação não depende de conexão de rede externa, o que aumenta a estabilidade
- Oferece suporte à implementação privada de servidores no local
A implementação técnica é baseada na estrutura de raciocínio local vLLM e o processo de implantação consiste em três etapas principais:
- Faça o download do modelo pré-treinado do Hugging Face (aprox. 15 GB de armazenamento)
- Configuração do ambiente de tempo de execução do Python 3.8+ e das dependências do vLLM
- Iniciar o serviço local da API REST (porta padrão 8000)
O programa foi avaliado quanto à segurança por várias instituições financeiras e é particularmente adequado para processamento:
- Documentos contratuais que contêm informações do cliente
- Registros médicos de instituições médicas
- Informações técnicas confidenciais de organizações de pesquisa e desenvolvimento
Implementado para atingir uma taxa de processamento estável de 3 a 5 páginas por segundo.
Essa resposta foi extraída do artigoRolmOCR: modelo de OCR de documentos para reconhecimento de caracteres manuscritos e inclinadosO