O mecanismo de legendas da Wavel AI combina as tecnologias de Reconhecimento Automático de Fala (ASR) e Processamento de Linguagem Natural (NLP) para oferecer suporte à geração de legendas em tempo real em mais de 40 idiomas, fornecendo suporte essencial à acessibilidade de conteúdo para deficientes auditivos e estudantes de idiomas estrangeiros. A inovação do sistema é a adoção do algoritmo de previsão de registro de data e hora, que permite que a precisão da troca de legendas atinja o nível de 200 ms, superando em muito o padrão médio do setor de 500 ms. O formato de saída é compatível com os padrões do setor, como SRT e VTT, e pode ser usado diretamente em plataformas de streaming profissionais, como a Netflix.
No setor de educação, esse recurso ajudou uma plataforma de cursos on-line a converter 300 horas de vídeos de palestras em recursos de aprendizagem com legendas em vários idiomas, aumentando a taxa de conclusão dos alunos em 351 TP3 T. A equipe de tecnologia também desenvolveu um modelo adaptável ao domínio para terminologia profissional, que alcançou uma precisão de reconhecimento de 921 TP3 T em setores verticais, como saúde e direito.
Essa resposta foi extraída do artigoWavel AI: uma ferramenta para geração rápida de dublagem e legendagem de vídeos multilínguesO