A tecnologia de reconhecimento de legendas de vídeo do Oulu Translation Plugin usa uma estrutura de aprendizagem profunda para obter uma precisão de reconhecimento em tempo real de até 95%. O sistema pode lidar de forma inteligente com closed captions (CC) e legendas abertas de várias plataformas de vídeo, oferecendo suporte aos principais sites de vídeo, como Netflix e YouTube. Os testes técnicos mostram que o atraso da tradução é controlado em 1,2 segundo em um cenário de transmissão de notícias padrão com uma taxa de fala de 140 palavras/minuto.
Em termos de princípio de implementação, o sistema primeiro captura elementos de texto em quadros de vídeo por meio da tecnologia OCR, depois analisa as relações contextuais usando redes neurais convolucionais sequenciais de tempo e, por fim, chama a interface de tradução multimotor para gerar legendas no idioma de destino. Os cenários típicos de aplicação incluem: estudantes internacionais assistindo a vídeos de aulas profissionais para obter comparações bilíngues; vendedores de comércio eletrônico internacionais analisando vídeos de avaliação de produtos estrangeiros; e entusiastas de idiomas acompanhando diálogos de filmes para praticar a pronúncia.
Em comparação com as ferramentas tradicionais de tradução de legendas, os recursos inovadores dessa função são: correspondência automática da linha do tempo do vídeo para manter o som e a imagem sincronizados; suporte à biblioteca de terminologia personalizada para garantir a precisão do conteúdo profissional; e fornecimento do modo de referência cruzada bilíngue para facilitar o aprendizado. Esses recursos fazem dela a solução de tradução de vídeo no navegador mais completa do mercado atual.
Essa resposta foi extraída do artigoPlug-in de tradução do OuluO































