Análise de gargalos de desempenho
A velocidade de conversão é afetada principalmente pelo desempenho da CPU/GPU, pelo número de páginas do PDF e pela complexidade da imagem. Os testes de benchmark mostram que: uma CPU comum leva cerca de 3 a 5 minutos para processar 10 páginas.
Acelerar o programa
- aceleração de hardwareModificação
device="cuda:0"GPU NVIDIA habilitada (driver CUDA necessário) - arquivo de lotePara PDFs de catálogos com vários capítulos, recomenda-se mesclar os arquivos após a conversão.
- parametrização: Configurações
extract()(usado em uma expressão nominal)skip_images=TrueProcessamento de imagens puláveis
Técnicas avançadas
- Os sistemas Linux podem adicionar
OMP_NUM_THREADS=4Variável de ambiente para controlar o número de threads - O modelo é residente na memória após o carregamento e é adequado para uso com
while TrueProcessamento contínuo em loop de vários arquivos - Recomenda-se usar primeiro os arquivos de tamanho grande (>50 MB)
pdfseparateDivisão de ferramentas
Essa resposta foi extraída do artigoPDF Craft: documentos digitalizados em PDF para ferramentas de código aberto MarkdownO































