Para instalar o SmolDocling, siga estas etapas:
- Preparação ambientalVerifique se o Python 3.8+ está instalado; recomenda-se usar um ambiente virtual
- Instalação de dependênciasExecutar comando pip install torch transformers docling_core
- Aceleração de GPU(Opcional): Instale a versão CUDA do PyTorch para velocidade, disponível por meio do torch.cuda.is_available()Detecção de suporte
O processo de uso é dividido em cinco estágios:
- Carregamento de imagens: Uso load_image()Função para importar a imagem a ser processada
- Inicialização do modeloDownload automático dos pesos do modelo via Hugging Face (é necessária uma primeira conexão com a Internet)
- Conversão de documentosGerar DocTags usando um modelo de prompt específico
- conversão de formatoExportar DocTags para formatos populares, como Markdown.
- Otimização avançadaUsuários de GPU podem ativar o processamento acelerado do flash_attention_2
Observe que podem ser necessários ajustes ao processar imagens grandes max_new_tokens (padrão 8192), recomenda-se imprimir os resultados intermediários para depuração ao usá-lo pela primeira vez.
Essa resposta foi extraída do artigoSmolDocling: um modelo de linguagem visual para o processamento eficiente de documentos em um pequeno volumeO































 Português do Brasil
Português do Brasil				 简体中文
简体中文					           English
English					           日本語
日本語					           Deutsch
Deutsch