
Smart Dictation: uma ferramenta de processamento de áudio com IA que combina recursos de transcrição, tradução e resumo
O Smart Dictation é um poderoso aplicativo para macOS que utiliza tecnologia avançada de IA para ajudar os usuários a converter facilmente gravações de áudio em texto. O aplicativo integra os mais recentes modelos GPT-4o e Whisper da OpenAI para fornecer transcrição, tradução e resumo precisos. Não importa se você está gravando uma reunião...

Voquill: plug-in de navegador que converte fala em texto
O Voquill é uma ferramenta de IA instalada no Chrome. Ele permite que os usuários usem a entrada de voz em vez de digitar no teclado em qualquer site. Quando estiver escrevendo um e-mail, respondendo a uma mensagem de bate-papo ou editando um documento, basta falar e o Voquill converterá sua voz em texto em tempo real. Além do ditado de voz básico, essa ferramenta oferece um...

Grabcube: vídeo para download gratuito com ferramenta de transcrição e tradução de IA
O Grabcube é uma ferramenta gratuita de processamento de áudio e vídeo que se concentra no download de vídeo e áudio, na conversão de fala em texto por IA, na tradução de legendas e na edição. Ele é compatível com mais de 1.000 plataformas principais, incluindo YouTube, Bilibili, Vimeo etc., e permite que os usuários baixem arquivos de vídeo e áudio em vários formatos sem restrições.

Kitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantável
O Kitten-TTS-Server é um projeto de código aberto que fornece um servidor com recursos aprimorados para o modelo leve KittenTTS. Os usuários podem usar esse projeto para criar seu próprio serviço de conversão de texto em fala (TTS). A principal vantagem desse projeto é que ele se baseia no modelo original, acrescentando uma página da Web intuitiva ...

AI-Chatbox: projeto de diálogo inteligente de fala para texto baseado no ESP32S3
O AI-Chatbox é um projeto de interação por voz baseado na placa de desenvolvimento ESP32S3. Os usuários conversam com o modelo grande (LLM) por voz, o dispositivo converte a voz em texto e a envia para o modelo grande; depois de obter a resposta, ela pode ser convertida em transmissão de voz. O projeto foi desenvolvido usando a linguagem Rust, integrada à ferramenta de reconhecimento de voz Vosk, adequada para...

Whisper on Cloudflare AI: uma ferramenta gratuita para converter áudio em texto e gerar legendas
O Whisper_Cloudflare é um projeto de código aberto criado pelo desenvolvedor thun888 e hospedado no GitHub. Ele se baseia no modelo Whisper da OpenAI e combina a arquitetura sem servidor do Cloudflare Workers para fornecer uma conversão de voz em texto altamente eficiente...

Spokenly: uma ferramenta de conversão de voz em texto para macOS
O Spokenly é uma ferramenta de conversão de fala em texto projetada para o macOS, criada para ajudar os usuários a inserir texto rapidamente por voz e melhorar a eficiência do trabalho. Ele utiliza tecnologias avançadas de IA (como Whisper e GPT-4o) para converter a fala em texto em tempo real, suporta mais de 100 idiomas e é adequado para uma variedade de cenários, como...

Vibe Musicing: gerador de música com IA (gratuito, on-line)
O Vibe Musicing é um gerador de música com IA on-line gratuito que permite a todos criar rapidamente suas próprias músicas originais sem a necessidade de uma base musical. Os usuários podem escolher o estilo musical, preencher as letras ou deixar que a IA gere as letras automaticamente para personalizar facilmente a melodia, o ritmo e a atmosfera.

AI Song Creator: ferramenta de IA para transformar rapidamente textos em músicas originais de alta qualidade
O AI Song Creator é uma plataforma on-line de geração de música com IA que permite aos usuários gerar músicas e letras originais de qualidade profissional em 30 a 90 segundos, inserindo uma descrição de texto ou letra. O site oferece suporte a mais de 40 estilos musicais, incluindo música eletrônica de dança, lo-fi, clássica e K-Pop, e é adequado para criadores de conteúdo,...

OpenWispr: aplicativo de desktop de fala para texto que prioriza a privacidade
O OpenWispr é um aplicativo de desktop de código aberto de conversão de fala em texto baseado na tecnologia OpenAI Whisper que converte rapidamente a fala do usuário em texto. Ele oferece opções de processamento local e em nuvem, com ênfase na proteção da privacidade, e os dados podem ser deixados totalmente locais. Os usuários podem iniciar rapidamente o ditado com teclas de atalho globais, e o texto é colado automaticamente na posição do cursor, adequado para...

TEN: uma ferramenta de código aberto para criar inteligências de IA de fala multimodal em tempo real
O TEN Framework é uma plataforma de software de código aberto focada em ajudar os desenvolvedores a criar inteligências de IA de fala em tempo real, multimodais e de baixa latência. Ele é compatível com várias linguagens de programação, incluindo C, C++, Go, Python, JavaScript e TypeScript. Os desenvolvedores podem usar o TEN Framework para criar rapidamente fala, visão e texto com...

Zaia Health: o assistente de voz com IA que monitora e melhora os hábitos de saúde
O Zaia Health é um aplicativo de saúde com inteligência artificial centrado em um assistente de voz chamado Zaia. O aplicativo foi desenvolvido para ajudar os usuários a se concentrarem e melhorarem seus hábitos de saúde. Por meio da interação de voz, ele atua como um companheiro pessoal de saúde, orientando os usuários para uma rotina mais regular nas áreas de sono, exercícios, nutrição e saúde mental...

FineShare: uma ferramenta de criação para gerar voz e música de IA
O FineShare é uma plataforma focada em tecnologia de áudio e vídeo com IA, oferecendo uma variedade de ferramentas para ajudar os usuários a criar conteúdo de voz, música e vídeo de alta qualidade. Os principais produtos do site incluem FineVoice, Singify e FineCam para geração e conversão de voz, criação de música com IA e câmera virtual...

SpleeterGui: ferramenta fácil de separação de faixas de música
O SpleeterGui é um aplicativo de desktop para usuários do Windows, baseado no Spleeter, uma biblioteca de separação de músicas de código aberto desenvolvida pelo Deezer, que permite aos usuários separar arquivos de música em várias faixas, como vocais, bateria, baixo etc., sem precisar usar a linha de comando, por meio de uma interface gráfica simples. Os usuários podem facilmente...

CyberSmart: conversão de texto em fala e vídeo humano digital
Xunfei Zhizuo é uma plataforma desenvolvida pela Xunfei para fornecer serviços de criação de conteúdo de inteligência artificial. Sua principal função é converter o texto inserido pelo usuário em fala, um processo geralmente chamado de “dublagem de IA” ou “síntese de fala”. Os usuários podem escolher entre uma variedade de vozes virtuais pré-programadas (ou seja, “âncoras”) com estilos diferentes, como noticiários...

Any2Text: ferramenta de IA gratuita para conversão de áudio e vídeo em texto
O Any2Text é uma ferramenta on-line gratuita que se concentra na conversão rápida de arquivos de áudio e vídeo em texto. Utiliza tecnologia avançada de reconhecimento de fala com IA, suporta mais de 100 idiomas e é adequada para uma variedade de cenários, como gravação de reuniões, transcrição de podcasts e geração de legendas. Os usuários podem usá-lo sem registro, é fácil de operar e você pode fazer upload de arquivos para obter um texto final de alta precisão...

Parrot TTS: uma ferramenta de leitura que transforma texto da Web em fala natural
O Parrot TTS é uma extensão do Chrome projetada para converter texto da Web em fala natural. Ela usa tecnologia avançada de IA para proporcionar uma experiência de voz quase humana, resolvendo o problema das ferramentas tradicionais de conversão de texto em fala que soam mecânicas. Os usuários podem converter artigos, notícias ou materiais de pesquisa em áudio com um clique, o que é adequado para multitarefas...

Wavel AI: uma ferramenta para geração rápida de dublagem e legendagem de vídeos multilíngues
A Wavel AI é uma plataforma baseada em IA focada em ajudar os usuários a criar e localizar rapidamente o conteúdo de vídeo. Ela facilita a criação de conteúdo multilíngue de vídeo e áudio por meio de recursos como clonagem de voz, conversão de texto em fala e geração automática de legendas. A plataforma suporta mais de 70 idiomas e oferece mais de 1.000 vozes realistas para os criadores de conteúdo...

wukong-robot: um projeto de alto-falante inteligente para criar um diálogo de voz personalizado em chinês
O wukong-robot é um robô de diálogo de voz em chinês de código aberto e um projeto de alto-falante inteligente, projetado para ajudar os desenvolvedores a criar rapidamente alto-falantes inteligentes personalizados. Ele é compatível com reconhecimento de fala em chinês, síntese de fala e função de diálogo em várias rodadas, integrado com ChatGPT, Baidu, KDDI e outras tecnologias. O design do projeto é modular, os plug-ins e os recursos podem ser estendidos livremente, adequados...
voltar ao topo