O Audibit usa uma estratégia paralela de dois motores para garantir a qualidade do áudio:
- Mecanismo OpenAIVoz suave: fornece uma voz suave que se aproxima da voz de uma pessoa real, com suporte para controle de entonação e expressão de emoção.
- Motor LemonfoxFoco na pronúncia precisa de termos técnicos, especialmente para conteúdo técnico
Em um teste real, após a conversão de um artigo técnico de 3.000 palavras:
- Tempo médio de geração de cerca de 90 segundos (dependendo do tamanho do artigo)
- Taxa de amostragem de áudio mantida em nível de CD de 44,1 kHz
- Controle de ruído de fundo abaixo de -60dB
Para suporte a idiomas, a versão atual reconhece automaticamente os seguintes idiomas:
- Inglês (pronúncia americana/britânica opcional)
- chinês simplificado
- Idioma japonês
- Idioma espanhol
É importante observar que o sistema determina automaticamente o tipo de idioma com base nos metadados do artigo, e os usuários também podem definir manualmente o esquema de fala preferido em config/tts.js. Futuras iterações planejam obter uma correspondência automática mais precisa por meio de modelos de detecção de idioma.
Essa resposta foi extraída do artigoAudibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidosO
































