O Zhipu AI Input Method (AutoTyper) é uma ferramenta de entrada inteligente para desktop desenvolvida pela Zhipu AI, projetada para revolucionar a experiência de entrada de texto na interação homem-computador por meio da tecnologia de modelos grandes.Aproveitando o modelo de reconhecimento de voz GLM-ASR e os recursos do agente AutoGLM, este software transcende as limitações dos métodos de entrada tradicionais confinados à mera “digitação”. Além de oferecer uma conversão de voz para texto excepcionalmente precisa, com suporte para entrada mista em chinês-inglês e reconhecimento de vários dialetos, sua principal força reside na “escrita assistida por IA”.Os usuários podem gerar texto estruturado diretamente por meio de comandos de voz ou refinar, traduzir e reescrever textos existentes (por exemplo, convertendo a linguagem coloquial em correspondência formal ou adaptando-se ao estilo literário de Lu Xun). Não se trata apenas de um substituto do teclado, mas de um plug-in de produtividade capaz de compreensão contextual e raciocínio. Flutuando acima de todos os aplicativos de desktop, ele estabelece um novo paradigma de trabalho eficiente no escritório — “você fala, eu escrevo” — tornando a criação de conteúdo e a comunicação mais fluidas e inteligentes.
Lista de funções
- Conversão de voz em texto de alta precisãoBaseado no modelo GLM-ASR-2512, ele oferece suporte ao reconhecimento de voz em tempo real ultrarrápido, processa com precisão entradas mistas em chinês e inglês e acomoda vários dialetos, incluindo Sichuanês, Cantonês e Chinês do Nordeste.
- Polimento e reescrita com tecnologia de IAOferece vários estilos de escrita predefinidos (como “para o chefe”, “para colegas”, “estilo Lu Xun”, “estilo tradutor”, etc.), transformando instantaneamente instruções verbais simples em expressões escritas adequadas.
- Geração de textos publicitários para múltiplos cenáriosCom uma biblioteca abrangente de modelos de redação pré-construídos, incluindo relatórios de trabalho, pedidos de licença, avisos de reunião, candidaturas a empregos e redação publicitária para o Xiaohongshu, os usuários precisam apenas ditar seus requisitos básicos para que a IA gere automaticamente documentos completos.
- Tradução em tempo real e comunicação entre idiomasSuporta tradução direta de voz para vários idiomas estrangeiros, incluindo inglês, francês, alemão e japonês, facilitando a comunicação internacional.
- Suporte global flutuante e entre aplicativosExistindo como uma janela flutuante, ele suporta invocação direta em qualquer software de desktop capaz de inserir texto, incluindo WeChat, Feishu, Word, Notion e navegadores.
- Processamento de textos longos: Capaz de lidar com entradas de voz prolongadas, tornando-o adequado para compilar atas de reuniões e ditar artigos longos.
/n
Usando a Ajuda
A filosofia de design por trás do Método de Entrada Zhipu AI é “invisibilidade e eficiência”. Uma vez instalado, ele funciona como uma ferramenta auxiliar no nível do sistema. Abaixo está um guia detalhado de instalação e operação para ajudá-lo a começar rapidamente:
1. download e instalação
- downloadVisite o site oficial
https://autoglm.zhipuai.cn/autotyper/A página detectará automaticamente o seu sistema operacional (macOS ou Windows). Clique no botão “Baixar Cliente” para obter o pacote de instalação. - Instalação (Windows)Clique duas vezes no arquivo baixado
.exeSiga as instruções para concluir a instalação. Depois de instalado, o software será iniciado automaticamente e ficará na bandeja do sistema. - Instalação (macOS): Clique duas vezes
.dmgArraste o ícone “Zhipu AI Input Method” para a pasta Aplicativos. Ao iniciar pela primeira vez, o sistema solicitará que você conceda permissões. Navegue até Configurações do sistema → Privacidade e segurança → Acessibilidade e marque a caixa para Zhipu AI Input Method para garantir que ele possa controlar a entrada de texto. Além disso, nas permissões do Microfone, permita que ele acesse o dispositivo de gravação.
2. Login na conta
Após iniciar o software, faça login usando seu número de celular ou digitalizando o código QR na interface via WeChat. Novos usuários normalmente recebem créditos ou tempo de teste gratuitos (sujeito às últimas promoções oficiais).
3. operação de funções essenciais
- Entrada de voz (modo básico)::
- Coloque o cursor em qualquer campo de entrada (como uma janela de bate-papo do WeChat ou um documento do Word).
- Pressione e mantenha pressionada a tecla de atalho do teclado (o padrão normalmente é
F1talvezOptionChave (pode ser personalizada nas configurações). - Comece a falar e uma animação ondulada aparecerá na tela para indicar que o áudio está sendo capturado.
- Ao soltar a tecla, o texto aparecerá imediatamente na tela.
- Polimento e reescrita por IA (modo avançado)::
- Método de seleção de textoSelecione uma parte do texto que você já digitou com o mouse. Um pequeno botão “Aprimoramento de IA” aparecerá ao lado do ícone flutuante do software. Clique nele e escolha o estilo desejado (como “Mais formal” ou “Traduzir para o inglês”). O texto gerado pela IA substituirá automaticamente o original ou será copiado para a área de transferência.
- Método de comando de vozEnquanto mantém pressionada a tecla de atalho, você pode dar comandos de voz diretamente, como: “Redija um pedido de licença para o chefe, alegando motivos familiares urgentes e solicitando dois dias de licença”. Ao soltar a tecla, a IA não digitará imediatamente essa frase, mas gerará um e-mail de pedido de licença com estrutura formal.
- Alterar estilo de entrada::
Na interface da janela flutuante, toque no botão de configurações ao lado do ícone do microfone para predefinir o estilo de saída. Por exemplo, configurá-lo para “Inglês” traduzirá automaticamente o seu chinês falado para texto em inglês exibido na tela.
4. Configurações personalizadas
Ao clicar no ícone de configurações na bandeja do sistema ou na bola flutuante, você pode:
- Ajuste a sensibilidade do microfone.
- Personalize o atalho de ativação para evitar conflitos com outros softwares.
- Gerencie modelos de prompts usados com frequência para criar seu próprio assistente de escrita personalizado.
Recomenda-se aos usuários iniciantes que pratiquem a função de entrada de voz por toque longo no Bloco de Notas para se familiarizarem com o ritmo de fala e o tempo de liberação. Normalmente, dez minutos são suficientes para se adaptar totalmente a este eficiente método de entrada sem usar as mãos.
cenário do aplicativo
- Comunicação e relatórios no local de trabalho
Ao responder às mensagens do WeChat do seu gerente ou redigir relatórios semanais, basta ditar o essencial (por exemplo, “Informe ao Sr. Wang que o projeto foi adiado por três dias devido a problemas no servidor”), selecionar o estilo “Orientado para o gerente” e a IA irá gerar automaticamente um texto de relatório diplomático, profissional e bem estruturado, evitando qualquer constrangimento causado por frases inadequadas. - Conferências internacionais e correspondência
Profissionais de comércio exterior ou estudantes internacionais que lidam com correspondência em inglês podem ditar seu conteúdo em chinês diretamente, selecionando o estilo “e-mail em inglês” para saída. O software não apenas fornece traduções precisas, mas também se adapta automaticamente ao formato e às expressões educadas esperadas na correspondência comercial, aumentando significativamente a eficiência da comunicação. - Criação de conteúdo de mídia própria
Para os criadores do Xiaohongshu ou de vídeos curtos, a inspiração muitas vezes surge muito rapidamente para ser digitada. Usando o método de entrada Zhipu AI, você pode ditar rapidamente suas ideias e selecionar a opção “Estilo Xiaohongshu”. A IA adicionará automaticamente emojis, hashtags e converterá o texto em linguagem coloquial, gerando diretamente um rascunho pronto para publicação. - Ata da reunião em tempo real
Ao participar de reuniões como observador, abra seu bloco de notas e ative o modo de entrada de voz estendida. O software transcreve as discussões da reunião em texto em tempo real. Após a sessão, basta realizar uma revisão lógica simples da transcrição gerada para produzir atas completas da reunião.
QA
- Quais sistemas operacionais o Método de Entrada Zhipu AI suporta?
Atualmente, ele oferece suporte principalmente aos sistemas Windows e macOS. O site oficial disponibiliza clientes de download para ambas as plataformas. - Este software é totalmente gratuito?
O download e a instalação básicos do software são gratuitos. No entanto, a utilização de recursos de modelos grandes de IA (como transcrição de voz para texto ou aprimoramento de texto) pode consumir créditos. Novos registros de usuários geralmente recebem uma alocação de créditos gratuita (por exemplo, 2.000 créditos). Uma vez esgotados, os créditos podem precisar ser adquiridos por meio de canais oficiais ou obtidos através da participação em atividades promocionais. Para obter detalhes específicos, consulte as informações de cobrança dentro do software. - Ele pode substituir meu método de entrada pinyin atual?
É principalmente uma ferramenta auxiliar. Embora possa lidar com a grande maioria dos requisitos de entrada, funciona melhor em conjunto com os métodos tradicionais de entrada Pinyin/Wubi ao inserir palavras curtas específicas e não padronizadas ou ao redigir respostas extremamente breves em mensagens instantâneas. Coexiste perfeitamente com seus métodos de entrada existentes, como Sogou ou Microsoft Pinyin, sem qualquer conflito. - Qual é a precisão do reconhecimento de voz?
Baseado no modelo Zhipu GLM-ASR-2512, ele alcança uma precisão de reconhecimento excepcionalmente alta em ambientes silenciosos (com uma taxa de erro de caracteres extremamente baixa, de acordo com dados oficiais). Mesmo em condições com ruído de fundo moderado ou velocidades de fala mais rápidas, seu desempenho supera o dos mecanismos tradicionais de reconhecimento de fala offline.
































