A ShortGPT criou uma matriz de locução compatível com mais de 30 idiomas, integrando dois grandes sistemas de síntese de fala, o ElevenLabs e o Microsoft EdgeTTS. Essa combinação de tecnologias inclui a pronúncia de alta fidelidade do ElevenLabs (adequada para conteúdo de marca) e oferece a solução gratuita do EdgeTTS (adequada para projetos com orçamento limitado). O sistema ajusta automaticamente o ritmo dos fonemas ao lidar com idiomas complexos, como o coreano e o árabe, e reconhece a regra dos quatro tons ao lidar com o chinês. Em um caso real, uma instituição educacional usou seu mecanismo de tradução para converter automaticamente sua aula on-line de inglês em 12 versões de idiomas, com uma naturalidade de dublagem de 90% de satisfação do usuário. Essa amplitude de cobertura de idiomas supera os serviços tradicionais de terceirização de dublagem e custa apenas 1/5 da produção manual.
Essa resposta foi extraída do artigoShortGPT: uma estrutura de IA para geração automática de vídeos curtosO