Explicação do uso da função de fala
A interação de voz do Dippy foi projetada para imitar uma experiência telefônica real, com o seguinte fluxo:
método de ativação
No canto inferior direito da tela de bate-papo do personagem, clique emÍcone do microfone(A autorização dos privilégios de gravação é necessária para o primeiro uso), a interface mudará para o modo de visualização de ondulação de voz. O sistema detecta automaticamente o fim da entrada de voz, de modo que os usuários não precisam mudar manualmente.
Dicas e truques
- Preparação ambientalRecomendado para uso em ambientes abaixo de 60dB, com uma distância efetiva de 30cm.
- comando de fala (para reconhecimento de fala em computador)Suporte a frases naturais, como "tell a joke" (contar uma piada) e "today's weather" (previsão do tempo).
- diálogo em várias camadasMáximo de 90 segundos para cada segmento de voz, com um intervalo de 2 segundos para atendimento automático.
Características técnicas
A tecnologia de reconhecimento de fala de ponta a ponta (taxa de erro de palavras < 8%) é usada e suportada:
- Exibição de texto em tempo real
- 12 Reconhecimento de dialeto
- Análise do tom emocional (a velocidade/ritmo da fala afeta a emoção da resposta do personagem)
Os testes mostraram que a fluência do diálogo do modo de fala é 37% maior do que a do texto, o que é especialmente adequado para que os alunos de idiomas pratiquem a expressão oral.
Essa resposta foi extraída do artigoDippy: uma ferramenta interativa para conversar com personagens de IAO































