A implantação do ambiente do Docker para o dots.ocr está dividida nas seguintes etapas:
- Clonar o repositório de código:
git clone https://github.com/rednote-hilab/dots.ocr.git
- Vá para o diretório do projeto e instale as dependências:
cd dots.ocr && pip install -e .
- Use imagens oficiais pré-criadas (opcional): se você tiver problemas com a instalação local, poderá extrair a imagem do Docker diretamente para iniciar rapidamente o ambiente.
Observação: Os pesos do modelo precisam ser passados pelodownload_model.py
Os scripts são baixados separadamente e os nomes das pastas do caminho de salvamento não devem conter pontos (recomenda-se DotsOCR). Para ambientes de produção, recomenda-se a implantação em conjunto com a estrutura vLLM para otimizar o desempenho da inferência.
Essa resposta foi extraída do artigodots.ocr: um modelo visual-linguístico unificado para análise de layout de documentos multilínguesO