Para obter a conversão de fala em texto em um ambiente off-line, recomendamos o uso do recurso de modelo Whisper nativo do Spokenly. As etapas são as seguintes:
- Nas configurações do Spokenly, selecione "Speech Model" (Modelo de fala) e mude para a opção "Local Whisper Model" (Modelo de sussurro local).
- Certifique-se de que o dispositivo atenda aos requisitos mínimos de configuração (macOS 12.0 ou superior, 8 GB de RAM recomendados).
- Para melhorar a precisão do reconhecimento, use um microfone de boa qualidade em um ambiente silencioso e faça da clareza da articulação o critério principal.
- Para termos especiais ou vocabulário especializado, as regras de substituição podem ser predefinidas nos prompts de IA (por exemplo, "Substituir CRM por Sistema de gerenciamento de relacionamento com o cliente").
Observe que o modelo local tem um processamento de pontuação fraco, que pode ser adicionado manualmente em um estágio posterior ou definindo regras de aviso de IA (por exemplo, 'converter pontos finais em.') para otimizar a saída.
Essa resposta foi extraída do artigoSpokenly: uma ferramenta de conversão de voz em texto para macOSO