A Spokenly oferece soluções inteligentes para cenários multilíngues, como a combinação de chinês e inglês:
- Ative a função 『Detecção Automática de Idioma』 (padrão ligado), o sistema reconhecerá automaticamente a chave de idioma.
- Para cenários profissionais, é dada preferência a modelos avançados baseados em nuvem (por exemplo, GPT-4o), cuja precisão de reconhecimento híbrido multilíngue é mais de 30% superior à dos modelos locais.
- Quando houver um desvio no reconhecimento de um idioma específico, você poderá forçar temporariamente a designação do idioma dominante: desative a detecção automática em Configurações > Idioma e selecione o idioma dominante manualmente.
- Para termos-chave, uma pequena pausa ou um aumento no volume durante a entrada de voz pode ser usado para ajudar o sistema a reconhecer com mais precisão os pontos de transição de idioma.
Testes empíricos mostram que o modelo de nuvem pode reconhecer enunciados mistos de chinês e inglês com uma precisão de até 92%, o que é adequado para cenários profissionais, como anais de conferências internacionais.
Essa resposta foi extraída do artigoSpokenly: uma ferramenta de conversão de voz em texto para macOSO