O Spokenly é uma ferramenta de conversão de voz em texto projetada para o macOS, criada para ajudar os usuários a digitar texto rapidamente por voz e aumentar a produtividade. Ele utiliza tecnologias avançadas de IA, como Sussurro O Spokenly é um conversor de voz para texto em tempo real que suporta mais de 100 idiomas e é adequado para uma variedade de cenários, como escrita, programação, anotações etc. O Spokenly enfatiza a proteção da privacidade e oferece um modo de processamento local, para que os dados de voz não precisem ser carregados na nuvem. Os usuários podem usar teclas de atalho para acionar a entrada de voz, e o texto pode ser inserido diretamente na posição do cursor, tornando a operação simples e suave. Seja para o trabalho diário no escritório ou para a criação profissional, o Spokenly permite que os usuários digitem com calma e se concentrem na criação de conteúdo.
Lista de funções
- conversão de fala para texto em tempo realAtivado por teclas de atalho, a fala é instantaneamente convertida em texto e inserida na posição atual do cursor.
- Suporte a vários idiomasSuporte a mais de 100 idiomas, incluindo inglês, espanhol, chinês, etc., com detecção automática de idioma.
- modo de processamento localO uso de um modelo Whisper nativo permite que os dados de voz não saiam do dispositivo, protegendo a privacidade.
- Modelagem avançada na nuvemSuporte a modelos baseados em nuvem, como o GPT-4o, proporcionando maior precisão e velocidade.
- Controle de voz para MacAgente: Executa operações como abrir aplicativos e pesquisar na Web por meio do modo Agente.
- Otimização de texto com IACorrija automaticamente a gramática, formate o texto e até mesmo traduza ou reescreva o conteúdo.
- Histórico de transcriçãoSalvar todas as transcrições, suportar pesquisa, reprodução e exportação.
- Transcrição de arquivos de vídeoSuporte ao processamento direto de arquivos de vídeo, extraindo áudio e convertendo-o em texto.
- Atalhos personalizadosTecla de entrada de voz: Os usuários podem definir uma única tecla ou uma combinação de teclas para iniciar rapidamente a entrada de voz.
Usando a Ajuda
Processo de instalação
- Baixar o Spokenly: Acesso Mac App Store Ou no site oficial spokenly.app e clique no botão de download. O aplicativo tem apenas 2,9 MB e é baixado rapidamente.
- Instalação de aplicativosSe o download for concluído, abra o pacote de instalação e siga as instruções para concluir a instalação. O aplicativo aparecerá automaticamente na barra de menus do macOS.
- Concessão de autoridadeSpokenly: na primeira vez que iniciar o Spokenly, você será solicitado a conceder acesso ao microfone e aos recursos de assistência. Ative o acesso ao microfone e os recursos de assistência do Spokenly clicando em "Configurações do sistema > Privacidade e segurança" para garantir que a entrada de voz e as operações entre aplicativos funcionem corretamente.
- Configuração de teclas de atalho: Abra o Spokenly e entre na tela de configurações; a tecla de atalho padrão é Right (Direita) Comando (⌘). Isso pode ser personalizado pelo usuário como uma única tecla, como F15, ou uma combinação de teclas para garantir que não haja conflito com outros aplicativos.
Uso
1. fala para texto em tempo real
- transcrição inicialTecla de atalho: Coloque o cursor em qualquer caixa de entrada de texto (por exemplo, navegador, e-mail, editor de código) e pressione a tecla de atalho definida (tecla de comando direita padrão). A tela exibirá a janela de transcrição.
- Comece a falar.O Spokenly converte sua voz em texto em tempo real e o exibe na janela. Depois de falar, pressione a tecla de atalho novamente e o texto será automaticamente inserido na posição do cursor.
- Selecione o modeloModelo de voz: Selecione um modelo Whisper local (privacidade em primeiro lugar) ou um modelo em nuvem (por exemplo, GPT-4o, requer conexão com a Internet) nas configurações do Modelo de voz. O modelo local é adequado para ambientes sem rede, enquanto o modelo em nuvem é mais preciso.
- lidar com a pontuaçãoModelos de nuvem (por exemplo, Whisper Large v3) suportam a adição automática de pontuação. Os modelos locais do Whisper não oferecem suporte ao reconhecimento direto de pontuação, mas isso pode ser resolvido por meio da otimização de texto da IA. Por exemplo, se você definir o prompt da IA como "Transforme 'ponto de exclamação' em '! para "Hi!" em sua voz.
2. suporte multilíngue e detecção automática
- O Spokenly suporta mais de 100 idiomas, incluindo inglês, chinês, espanhol e outros. Não há necessidade de selecionar manualmente um idioma, pois o aplicativo detecta automaticamente o idioma em que a voz é inserida.
- procedimentoSelecione "Automatic Language Detection" (Detecção automática de idioma) nas configurações e, quando você começar a falar, o sistema fará a correspondência do idioma com o conteúdo da sua voz e o transcreverá. Por exemplo, frases mistas em inglês e chinês podem ser reconhecidas corretamente.
- advertência: A eficácia do reconhecimento de idiomas varia de acordo com o modelo. Modelos em nuvem (por exemplo ElevenLabs Scribe) tem melhor desempenho em cenários multilíngues, mas os modelos nativos podem ser menos precisos em idiomas raros.
3) Mac controlado por voz (modo Agente)
- Ativação do modo de agenteModo Agente: Alterne para o Modo Agente em Configurações. Esse modo transforma sua voz em comandos para controlar as operações do Mac.
- Comandos comuns::
- "Open Safari": abre o navegador Safari.
- "Search Google Weather": Pesquise informações meteorológicas em seu navegador padrão.
- "Run terminal commands Display system information" (Executar comandos do terminal Exibir informações do sistema): Executar comandos do terminal.
- Comandos personalizadosAdicione frases e ações de acionamento à guia Quick Commands. Por exemplo, defina "Open Lifehacker" como uma frase de acionamento que vincula o URL do site do Lifehacker e abre a página toda vez que você disser "Open Lifehacker".
- tomar nota deComandos complexos precisam ser claramente expressos para evitar expressões vagas. Atalhos com parâmetros serão suportados em versões futuras.
4. otimização de texto com IA
- Configuração de prompts de IADigite comandos personalizados nas configurações de prompts de IA, como "Traduzir texto para o espanhol" ou "Corrigir gramática e formato para correspondência oficial".
- fluxo de trabalhoApós gravar sua voz, selecione o atalho do prompt de IA e o sistema processará o texto transcrito de acordo com a instrução. Por exemplo, ao dizer "Reunião amanhã às 9" e aplicar o prompt "Formatar como e-mail formal", o resultado poderá ser "Prezado colega, a reunião está agendada para amanhã às 9 horas".
- Cenários aplicáveisIdeal para gerar rapidamente documentos profissionais, traduzir conteúdo multilíngue ou otimizar rascunhos.
5. histórico de transcrição e exportação
- Ver históricoToque em "History" (Histórico) na interface principal do aplicativo para visualizar todas as transcrições. Suporte à pesquisa por palavras-chave.
- Reprodução e exportaçãoSelecione um registro e clique em "Playback" (Reproduzir) para ouvir o áudio original ou clique em "Export" (Exportar) para salvá-lo como um arquivo de texto, compatível com os formatos .txt e .doc.
- Armazenamento gerenciadoO áudio e o texto do modelo local são armazenados no Mac no caminho
~/Library/Spokenly/Transcriptions
. O modelo de nuvem não salva o áudio e só o processa temporariamente.
6. transcrição de arquivos de vídeo
- Importar vídeoNa versão 2.7.3 e superior, clique no menu "File" (Arquivo) e selecione um arquivo de vídeo (compatível com formatos como MP4, MOV, etc.).
- processo de transcriçãoAplicação: O aplicativo extrai automaticamente o áudio e o converte em texto, envia-o para uma caixa de texto especificada ou salva-o como um arquivo. Adequado para geração de legendas ou organização de registros de reuniões.
- Dicas de desempenhoArquivos de vídeo grandes podem exigir mais tempo de processamento, portanto, recomenda-se um dispositivo Mac de alto desempenho.
advertência
- requisito de redeOs modelos locais do Whisper não exigem uma rede, mas os modelos em nuvem exigem uma conexão estável.
- Requisitos de equipamentoMacOS 12.0 ou superior: recomenda-se 8 GB ou mais de RAM para suportar o modelo local.
- PrivacidadeNo modo local, os dados de voz não são carregados. O modo de nuvem usa serviços de terceiros (por exemplo, OpenAI, Deepgram), o áudio é excluído instantaneamente e não é armazenado. Os usuários podem verificar a política de privacidade de terceiros.
cenário do aplicativo
- Anotações rápidas
- Descrição da cenaSpokenly: em uma reunião ou sala de aula, os usuários precisam anotar rapidamente inspirações ou destaques. Com o Spokenly, pressione uma tecla de atalho para falar o conteúdo e o texto aparecerá instantaneamente no aplicativo de anotações, economizando tempo de digitação. A otimização de texto com IA agrupa a fala fragmentada em anotações estruturadas.
- Programação e documentação
- Descrição da cenaO Spokenly oferece suporte a vários idiomas para ambientes de idiomas mistos (por exemplo, inglês e chinês) e permite que programadores ou escritores insiram comentários de código ou artigos longos por voz. O Spokenly oferece suporte a vários idiomas e é adequado para ambientes de idiomas mistos (por exemplo, arquivos em inglês e chinês).
- comunicação multilíngue
- Descrição da cenaOs membros de equipes multinacionais usam o Spokenly para transcrever reuniões multilíngues em tempo real ou traduzi-las para o idioma de destino com avisos de IA, facilitando a organização de e-mails ou transcrições de bate-papo.
- Assistência à acessibilidade
- Descrição da cenaA transcrição altamente precisa e os comandos personalizáveis do Spokenly aumentam a eficiência.
QA
- O Spokenly é totalmente gratuito?
- Os recursos básicos do Spokenly são gratuitos, incluindo os modelos locais do Whisper e a transcrição integrada da Apple. Os modelos premium na nuvem (por exemplo, GPT-4o) podem introduzir assinaturas pagas no futuro, mas atualmente são gratuitos.
- Como você garante a privacidade dos dados de voz?
- No modo local, os dados não saem do Mac, e o modo nuvem usa um serviço de terceiros que exclui o áudio assim que ele é processado. Os usuários podem ativar o Modo Local para bloquear solicitações de rede.
- Quais são os idiomas suportados?
- Suporta mais de 100 idiomas, incluindo inglês, chinês, espanhol e outros. A detecção automática de idiomas é adequada para cenários mistos de vários idiomas, com resultados que variam de modelo para modelo.
- Como lidar com a transcrição de arquivos de vídeo?
- Selecione o vídeo no menu "File" (Arquivo), o aplicativo extrai o áudio e o converte em texto. Compatível com o formato MP4, MOV, adequado para geração de legendas ou organização de registros.
- Ele pode ser usado off-line?
- Os modelos locais do Whisper suportam transcrição off-line, mas são um pouco menos precisos do que os modelos baseados em nuvem. Certifique-se de ter espaço de armazenamento suficiente em seu Mac.