A partir da versão 2.7.3, o Spokenly adicionou um novo recurso de transcrição de arquivos de vídeo, que pode lidar diretamente com MP4, MOV e outros formatos de vídeo comuns. O recurso extrai automaticamente o conteúdo de áudio do vídeo e o converte em informações de texto. Esse recurso inovador é especialmente adequado para usuários que precisam adicionar legendas a vídeos, organizar atas de reuniões ou trabalhar com materiais multimídia. Ele requer um alto nível de desempenho do sistema, portanto, recomendamos executá-lo em um dispositivo Mac com 8 GB ou mais de RAM para garantir um processamento eficiente.
Essa resposta foi extraída do artigoSpokenly: uma ferramenta de conversão de voz em texto para macOSO