A inovação do sistema é a introdução de um mecanismo de controle de prompt que permite que o usuário alterne os modos de processamento simplesmente modificando o comando de entrada. Por exemplo, ao usar o comando prompt_layout_only_en, somente a análise de layout de documentos em inglês é realizada, enquanto o modo prompt_ocr se concentra na extração de texto e filtra automaticamente o conteúdo decorativo. Esse design pode reduzir o tempo de troca de tarefas em mais de 80% em comparação com o método tradicional que exige o recarregamento do modelo. O sistema é pré-construído com 7 modelos de prompt profissionais, abrangendo uma variedade de cenários que vão desde a análise completa até a extração de elementos específicos.
Essa resposta foi extraída do artigodots.ocr: um modelo visual-linguístico unificado para análise de layout de documentos multilínguesO

































