Análise do problema
Muitas ferramentas de conversão de PDF têm um desempenho ruim quando se trata de preservar a estrutura original do documento (especialmente tabelas complexas, títulos de vários níveis).
Programa de otimização
- Configuração de seleção de modelo: Ao definir o
OPENAI_DEFAULT_MODELAs variáveis de ambiente podem ser selecionadas para uma versão maior do modelo que seja mais adequada para a compreensão do documento - paginaçãoConverta documentos complexos em páginas (2 a 5 páginas) e, em seguida, mescle os resultados para reduzir a complexidade de um único processo.
- script de pós-processamentoCódigo-fonte aberto: O código-fonte aberto permite que os usuários modifiquem
main.pyA lógica de pós-processamento no - teste e verificaçãoRecomendamos testar primeiro com arquivos pequenos, observar o efeito da conversão de formulário/título e, em seguida, ajustar os parâmetros para lidar com arquivos grandes.
Técnicas avançadas
Os usuários técnicos podem 1. ajustar os parâmetros de temperatura do modelo 2. modificar o modelo de prompt 3. adicionar regras de expressão regular personalizadas para melhorar ainda mais a qualidade da conversão de tipos específicos de documentos.
problemas comuns
Em caso de problemas de formatação, é recomendável verificar: 1. se o PDF original é um PDF baseado em texto 2. se a versão mais recente do modelo está sendo usada 3. se a tabela contém estruturas complexas, como células mescladas.
Essa resposta foi extraída do artigoMarkPDFDown: converte PDF em Markdown com base em um modelo multimodalO































