O sistema de conversão de texto em fala do Guidde usa tecnologia de rede neural profunda para suportar a síntese de fala em 112 idiomas e 230 dialetos. Em cenários de aplicativos empresariais multinacionais, esse recurso permite a geração de vídeos de treinamento com um clique em diferentes versões de idiomas. Por exemplo, a equipe da Microsoft Ásia usa o Guidde para produzir simultaneamente guias de operação do Office em chinês, inglês, japonês e coreano. O sistema é especialmente otimizado para a precisão da pronúncia de terminologia técnica, atingindo uma taxa de pronúncia correta de 98% em testes de TI, médicos e outros campos profissionais. Os usuários podem controlar as pausas de voz marcando sinais de pontuação e ajustar a taxa de fala de 80 a 160 palavras/minuto. Casos típicos mostram que o departamento de treinamento global da Unilever reduziu o custo da produção de vídeos multilíngues em 67% depois de adotar esse recurso.
Essa resposta foi extraída do artigoGuia: Crie rapidamente tutoriais e documentação em vídeo orientados por IAO
































