Solução de precisão de comando de voz
Um sistema de otimização de três camadas para melhorar a eficácia do reconhecimento de fala e da conversão de conteúdo:
- Preparação ambiental::
- Use um microfone com cancelamento de ruído, como os AirPods
- Mantenha o ruído ambiente <50dB (pode ser medido com o aplicativo do celular)
- Recomenda-se pronunciar as palavras a 15 cm do microfone em uma sala silenciosa.
- estrutura da falaCenário: Adote a fórmula "cena + tema + ação + modificação", por exemplo, "cena urbana noturna (cena), carro esportivo (tema) passando por um túnel de neon (ação), com trilhas de luz (modificação)".
- mecanismo de correção de erros::
- Ajuste manualmente os principais parâmetros usando a função "Correção de texto" depois de gerar uma visualização.
- Ativar a "verificação ortográfica" para termos técnicos (precisa ser ativada em Configurações)
Dica especial: os usuários com sotaque podem verificar a precisão da transferência de texto no iPhone Memo Voice Input antes de copiá-lo para a caixa de entrada de texto do JEO 3 para gerar.
Essa resposta foi extraída do artigoJEO 3: aplicativo para gerar vídeos usando texto, imagens ou falaO































