Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

Sussurro App é uma ferramenta gratuita e de código aberto que permite aos usuários gravar notas por voz e usar a tecnologia de IA para converter a voz em texto, gerando conteúdo como listas, blogs ou tarefas. O projeto é desenvolvido pela Nutlope, hospedado no GitHub, e baseado no JuntosOs modelos Whisper e Llama da ai permitem transcrição e processamento de texto eficientes. O aplicativo Whisper é simples de usar, com uma interface intuitiva para usuários que desejam gravar e organizar conteúdo rapidamente. O código-fonte é totalmente aberto e pode ser implementado livremente pelos usuários, e os dados são armazenados localmente com foco na proteção da privacidade.

 

Lista de funções

  • Gravação e transcrição de voz: grave a voz pelo microfone e converta-a rapidamente em texto.
  • AI Text Organiser: converta o texto transcrito em uma lista, blog ou lista de tarefas.
  • Suporte a vários idiomas: suporta transcrição de voz em vários idiomas, como inglês e chinês.
  • Armazenamento local: as gravações e o texto são armazenados no dispositivo do usuário para proteger a privacidade.
  • Implementação de código aberto: fornece código completo para suportar a implementação local ou na nuvem.
  • Integração de serviços de terceiros: combinação do Together.ai e do Convex para melhorar o desempenho da IA e do banco de dados.
  • Saída personalizada: suporte para ajuste da formatação de texto, como estilos de lista ou estruturas de blog.

Usando a Ajuda

Processo de instalação

Para usar o Whisper App, os usuários precisam implantar o projeto localmente ou na nuvem. Veja a seguir as etapas detalhadas:

  1. Clonagem do código do projeto
    Execute o seguinte comando no terminal para obter o código do aplicativo Whisper:

    git clone https://github.com/Nutlope/whisper.git
    

    Vá para o catálogo de projetos:

    cd whisper
    
  2. Instalação de dependências
    Certifique-se de que o Node.js esteja instalado (recomenda-se a versão mais recente do LTS). Execute o seguinte comando para instalar as dependências:

    npm install
    

    Isso instalará os pacotes necessários, como Next.js, Vercel AI SDK, etc.

  3. Configuração de variáveis de ambiente
    O Whisper App usa o Clerk para autenticação e o Convex para suporte ao banco de dados. As etapas de configuração são as seguintes:

    • Registre-se para obter uma conta Clerk (https://clerk.com), obtenha CLERK_SECRET_KEY responder cantando NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY.
    • No diretório raiz do projeto, crie o arquivo .env.local Arquivo, adicionar:
      CLERK_SECRET_KEY=your_clerk_secret_key
      NEXT_PUBLIC_CLERK_PUBLISHABLE_KEY=your_clerk_publishable_key
      
    • Login Convex (https://convex.dev), crie o projeto, obtenha CLERK_ISSUER_URL(por exemplo https://some-animal-123.clerk.accounts.dev).
    • Adicionar no Convex Dashboard CLERK_ISSUER_URLClique em "Salvar".
  4. Projetos em andamento
    Quando a configuração estiver concluída, inicie o servidor de desenvolvimento:

    npm run dev
    

    O projeto é executado em http://localhost:3000. Basta abrir seu navegador e visitar.

Uso

O aplicativo Whisper tem uma interface simples, que é adequada para começar a usar rapidamente. Veja abaixo um guia dos principais recursos:

1. registro e transcrição

  • Visite a página do aplicativo Whisper e faça login em sua conta usando o Clerk.
  • Clique no botão "Record" (Registrar) para autorizar o acesso ao microfone do navegador.
  • Inicie a gravação e clique em "Stop" (Parar) quando terminar. Recomenda-se gravar por no máximo 5 minutos de cada vez para garantir uma transcrição precisa.
  • O sistema converte a fala em texto usando o modelo Whisper da Together.ai e o resultado é exibido na página.

2. agrupamento de textos

  • Quando a transcrição estiver concluída, selecione o formato de saída (por exemplo, lista, blog, lista de tarefas).
  • A seleção de "List" gera uma lista de entradas; a seleção de "Blog" as organiza em postagens com títulos.
  • Os usuários podem editar o texto, ajustar o conteúdo ou adicionar detalhes.
  • Clique em Save (Salvar) para armazenar os resultados em seu banco de dados IndexedDB local.

3. personalização e otimização

  • Na tela Settings (Configurações), ajuste a formatação de saída, como os marcadores da lista ou o estilo de parágrafo do blog.
  • Suporte para otimização de texto por meio de modelos Llama, por exemplo, para correção gramatical ou tradução de idiomas.
  • O idioma de destino (por exemplo, chinês, inglês) pode ser selecionado nas configurações para transcrição ou tradução.

4. gerenciamento de dados e privacidade

  • O Whisper App armazena gravações e textos localmente no IndexedDB por padrão e não faz upload para a nuvem.
  • Para limpar os dados: Limpe o IndexedDB nas ferramentas de desenvolvimento do navegador ou exclua o caminho local. %APPDATA%\..\Local\com.bradenwong.whispering(Windows).
  • O processo de transcrição requer uma conexão com o Together.ai, portanto, é recomendável garantir uma rede estável.

advertência

  • A conexão com a Internet precisa ser estável para acessar os serviços Together.ai e Convex.
  • Se o microfone não funcionar, verifique as permissões do sistema (Windows: Configurações > Privacidade > Microfone; Mac: Preferências do Sistema > Segurança e Privacidade > Microfone).
  • Os projetos que dependem de APIs externas precisam verificar os créditos gratuitos ou o status da assinatura da Together.ai.
  • As primeiras implementações podem exigir a depuração de variáveis de ambiente, portanto, recomendamos consultar a documentação do GitHub.

cenário do aplicativo

  1. Coleta de registros de reuniões
    Os usuários registram discussões em reuniões e o Whisper App gera rapidamente atas ou listas de tarefas para a colaboração da equipe.
  2. Registro de notas de estudo
    Os alunos gravam o áudio da aula ou da palestra, que o aplicativo Whisper transforma em anotações estruturadas para facilitar a revisão e a organização.
  3. Criação de conteúdo de blog
    Os criadores de conteúdo inserem sua inspiração por voz e o Whisper App a agrupa em rascunhos de artigos para melhorar a eficiência da redação.
  4. Planejamento de missão individual
    Os usuários registram uma tarefa diária, que o Whisper App transforma em uma lista de tarefas para ajudar a gerenciar o tempo.

QA

  1. Quais idiomas são compatíveis com o aplicativo Whisper?
    Baseado no modelo Whisper da Together.ai, ele suporta inglês, chinês, espanhol e outros idiomas. Uma lista detalhada do suporte está disponível no site da Together.ai.
  2. Tenho que pagar para usar o aplicativo Whisper?
    O aplicativo Whisper é gratuito e de código aberto. Os serviços externos (por exemplo, Together.ai, Convex) podem incorrer em taxas, dependendo do uso.
  3. Como a privacidade dos dados é protegida?
    As gravações e o texto transcrito são armazenados localmente no IndexedDB, e o áudio é enviado ao Together.ai somente para transcrição, sem nenhum outro armazenamento no servidor.
  4. Qual é a base técnica necessária para a implementação?
    É suficiente ter familiaridade com Node.js básico e operações de linha de comando, e a documentação do GitHub fornece instruções detalhadas para iniciantes.
0Marcado
0Recomendado

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil