Inovações de desempenho nas principais tecnologias
O mecanismo de OCR de terceira geração do ImageTranslate oferece precisão de reconhecimento líder do setor por meio das seguintes inovações tecnológicas:
- Modelo de aprendizagem profunda: treinado com base na arquitetura ResNet50, suporta 20 tipos de detecção de direção de texto
- Design antiatolamento: manuseia com eficiência imagens de baixa resolução abaixo de 300 dpi
- Fusão multilíngue: a precisão do reconhecimento de textos complexos supera o 90% em CJK e outros textos complexos
No benchmark do conjunto de testes padrão (incluindo 10 tipos de imagens, como anúncios, documentos etc.), o reconhecimento do inglês impresso atinge 98,7% e o reconhecimento do chinês misto, chinês simplificado e chinês tradicional, atinge 95,2%. Em aplicações práticas, com a função de verificação semântica pós-tradução, a proporção das traduções finais utilizáveis pode ser aumentada para 99%. A tecnologia continua a otimizar sua adaptabilidade a fontes especiais e ruídos de fundo com a atualização mensal do modelo. A tecnologia continua a otimizar sua adaptabilidade a fontes especiais e ruídos de fundo por meio de atualizações mensais do modelo.
Essa resposta foi extraída do artigoImageTranslateO
































