Preparação para a instalação
Para usar o PDF Craft, você precisa:
- Um computador com Python 3.8 ou superior instalado
- Espaço suficiente no disco rígido para modelos de IA
- Conhecimento básico de operação de terminais
Etapas detalhadas de instalação
- Clonagem do Project Warehouse:
git clone https://github.com/oomol-lab/pdf-craft.git
- Vá para o catálogo de projetos:
cd pdf-craft
- Instale as bibliotecas dependentes:
pip install -r requirements.txt
- Se você tiver uma GPU, poderá instalar o suporte a CUDA:
pip install torch --extra-index-url https://download.pytorch.org/whl/cu117
Guia de conversão
O processo básico de conversão de arquivos PDF:
- Coloque os arquivos PDF a serem convertidos na pasta especificada
- Execute o script de conversão do Python
- Aguarde até que a ferramenta termine o processamento (os modelos de IA são baixados automaticamente na primeira execução)
- Verifique o arquivo Markdown de saída e a pasta de imagens que o acompanha
Essa resposta foi extraída do artigoPDF Craft: documentos digitalizados em PDF para ferramentas de código aberto MarkdownO































