Sussurro App é uma ferramenta gratuita e de código aberto que permite aos usuários gravar notas por voz e usar a tecnologia de IA para converter a voz em texto, gerando conteúdo como listas, blogs ou tarefas. O projeto é desenvolvido pela Nutlope, hospedado no GitHub, e baseado no JuntosOs modelos Whisper e Llama da ai permitem transcrição e processamento de texto eficientes. O aplicativo Whisper é simples de usar, com uma interface intuitiva para usuários que desejam gravar e organizar conteúdo rapidamente. O código-fonte é totalmente aberto e pode ser implementado livremente pelos usuários, e os dados são armazenados localmente com foco na proteção da privacidade.
Lista de funções
- Gravação e transcrição de voz: grave a voz pelo microfone e converta-a rapidamente em texto.
- AI Text Organiser: converta o texto transcrito em uma lista, blog ou lista de tarefas.
- Suporte a vários idiomas: suporta transcrição de voz em vários idiomas, como inglês e chinês.
- Armazenamento local: as gravações e o texto são armazenados no dispositivo do usuário para proteger a privacidade.
- Implementação de código aberto: fornece código completo para suportar a implementação local ou na nuvem.
- Integração de serviços de terceiros: combinação do Together.ai e do Convex para melhorar o desempenho da IA e do banco de dados.
- Saída personalizada: suporte para ajuste da formatação de texto, como estilos de lista ou estruturas de blog.
Usando a Ajuda
Processo de instalação
Para usar o Whisper App, os usuários precisam implantar o projeto localmente ou na nuvem. Veja a seguir as etapas detalhadas:
- Clonagem do código do projeto
Execute o seguinte comando no terminal para obter o código do aplicativo Whisper:git clone https://github.com/Nutlope/whisper.git
Vá para o catálogo de projetos:
cd whisper
- Instalação de dependências
Certifique-se de que o Node.js esteja instalado (recomenda-se a versão mais recente do LTS). Execute o seguinte comando para instalar as dependências:npm install
Isso instalará os pacotes necessários, como Next.js, Vercel AI SDK, etc.
- Configuração de variáveis de ambiente
O Whisper App usa o Clerk para autenticação e o Convex para suporte ao banco de dados. As etapas de configuração são as seguintes:- Registre-se para obter uma conta Clerk (
https://clerk.com
), obtenhaCLERK_SECRET_KEY
responder cantandoNEXT_PUBLIC_CLERK_PUBLISHABLE_KEY
. - No diretório raiz do projeto, crie o arquivo
.env.local
Arquivo, adicionar:CLERK_SECRET_KEY=your_clerk_secret_key NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=your_clerk_publishable_key
- Login Convex (
https://convex.dev
), crie o projeto, obtenhaCLERK_ISSUER_URL
(por exemplohttps://some-animal-123.clerk.accounts.dev
). - Adicionar no Convex Dashboard
CLERK_ISSUER_URL
Clique em "Salvar".
- Registre-se para obter uma conta Clerk (
- Projetos em andamento
Quando a configuração estiver concluída, inicie o servidor de desenvolvimento:npm run dev
O projeto é executado em
http://localhost:3000
. Basta abrir seu navegador e visitar.
Uso
O aplicativo Whisper tem uma interface simples, que é adequada para começar a usar rapidamente. Veja abaixo um guia dos principais recursos:
1. registro e transcrição
- Visite a página do aplicativo Whisper e faça login em sua conta usando o Clerk.
- Clique no botão "Record" (Registrar) para autorizar o acesso ao microfone do navegador.
- Inicie a gravação e clique em "Stop" (Parar) quando terminar. Recomenda-se gravar por no máximo 5 minutos de cada vez para garantir uma transcrição precisa.
- O sistema converte a fala em texto usando o modelo Whisper da Together.ai e o resultado é exibido na página.
2. agrupamento de textos
- Quando a transcrição estiver concluída, selecione o formato de saída (por exemplo, lista, blog, lista de tarefas).
- A seleção de "List" gera uma lista de entradas; a seleção de "Blog" as organiza em postagens com títulos.
- Os usuários podem editar o texto, ajustar o conteúdo ou adicionar detalhes.
- Clique em Save (Salvar) para armazenar os resultados em seu banco de dados IndexedDB local.
3. personalização e otimização
- Na tela Settings (Configurações), ajuste a formatação de saída, como os marcadores da lista ou o estilo de parágrafo do blog.
- Suporte para otimização de texto por meio de modelos Llama, por exemplo, para correção gramatical ou tradução de idiomas.
- O idioma de destino (por exemplo, chinês, inglês) pode ser selecionado nas configurações para transcrição ou tradução.
4. gerenciamento de dados e privacidade
- O Whisper App armazena gravações e textos localmente no IndexedDB por padrão e não faz upload para a nuvem.
- Para limpar os dados: Limpe o IndexedDB nas ferramentas de desenvolvimento do navegador ou exclua o caminho local.
%APPDATA%\..\Local\com.bradenwong.whispering
(Windows). - O processo de transcrição requer uma conexão com o Together.ai, portanto, é recomendável garantir uma rede estável.
advertência
- A conexão com a Internet precisa ser estável para acessar os serviços Together.ai e Convex.
- Se o microfone não funcionar, verifique as permissões do sistema (Windows: Configurações > Privacidade > Microfone; Mac: Preferências do Sistema > Segurança e Privacidade > Microfone).
- Os projetos que dependem de APIs externas precisam verificar os créditos gratuitos ou o status da assinatura da Together.ai.
- As primeiras implementações podem exigir a depuração de variáveis de ambiente, portanto, recomendamos consultar a documentação do GitHub.
cenário do aplicativo
- Coleta de registros de reuniões
Os usuários registram discussões em reuniões e o Whisper App gera rapidamente atas ou listas de tarefas para a colaboração da equipe. - Registro de notas de estudo
Os alunos gravam o áudio da aula ou da palestra, que o aplicativo Whisper transforma em anotações estruturadas para facilitar a revisão e a organização. - Criação de conteúdo de blog
Os criadores de conteúdo inserem sua inspiração por voz e o Whisper App a agrupa em rascunhos de artigos para melhorar a eficiência da redação. - Planejamento de missão individual
Os usuários registram uma tarefa diária, que o Whisper App transforma em uma lista de tarefas para ajudar a gerenciar o tempo.
QA
- Quais idiomas são compatíveis com o aplicativo Whisper?
Baseado no modelo Whisper da Together.ai, ele suporta inglês, chinês, espanhol e outros idiomas. Uma lista detalhada do suporte está disponível no site da Together.ai. - Tenho que pagar para usar o aplicativo Whisper?
O aplicativo Whisper é gratuito e de código aberto. Os serviços externos (por exemplo, Together.ai, Convex) podem incorrer em taxas, dependendo do uso. - Como a privacidade dos dados é protegida?
As gravações e o texto transcrito são armazenados localmente no IndexedDB, e o áudio é enviado ao Together.ai somente para transcrição, sem nenhum outro armazenamento no servidor. - Qual é a base técnica necessária para a implementação?
É suficiente ter familiaridade com Node.js básico e operações de linha de comando, e a documentação do GitHub fornece instruções detalhadas para iniciantes.