Smart Dictation: uma ferramenta de processamento de áudio com IA que combina recursos de transcrição, tradução e resumo
O Smart Dictation é um poderoso aplicativo para macOS que utiliza tecnologia avançada de IA para ajudar os usuários a converter facilmente gravações de áudio em texto. O aplicativo integra os mais recentes modelos GPT-4o e Whisper da OpenAI para fornecer serviços precisos de transcrição, tradução e resumo. Se você estiver se lembrando de .....
Voquill: plug-in de navegador que converte fala em texto
O Voquill é uma ferramenta de IA instalada no Chrome. Ele permite que os usuários usem a entrada de voz em vez de digitar no teclado em qualquer site. Quando estiver escrevendo um e-mail, respondendo a uma mensagem de bate-papo ou editando um documento, basta falar e o Voquill converterá sua voz em texto em tempo real. Além da audição básica de voz...
Grabcube: vídeo para download gratuito com ferramenta de transcrição e tradução de IA
O Grabcube é uma ferramenta gratuita de processamento de áudio e vídeo que se concentra em downloads de vídeo e áudio, conversão de fala em texto por IA, tradução e edição de legendas. Ele é compatível com mais de 1.000 plataformas convencionais, incluindo YouTube, Bilibili, Vimeo etc., e permite que os usuários baixem arquivos de vídeo e áudio em vários formatos sem limitações.
Kitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantável
O Kitten-TTS-Server é um projeto de código aberto que fornece um servidor com recursos aprimorados para o modelo leve KittenTTS. Os usuários podem usar esse projeto para criar seu próprio serviço de conversão de texto em fala (TTS). A principal vantagem desse projeto é que ele se baseia no modelo original, acrescentando um ...
AI-Chatbox: projeto de diálogo inteligente de fala para texto baseado no ESP32S3
O AI-Chatbox é um projeto de interação por voz baseado na placa de desenvolvimento ESP32S3. Os usuários conversam com o modelo grande (LLM) por voz, o dispositivo converte a voz em texto e a envia para o modelo grande; depois de obter a resposta, ela pode ser convertida em transmissão de voz. O projeto foi desenvolvido usando a linguagem Rust, integrada com o assistente de reconhecimento de voz Vosk...
Whisper on Cloudflare AI: uma ferramenta gratuita para converter áudio em texto e gerar legendas
O Whisper_Cloudflare é um projeto de código aberto criado pelo desenvolvedor thun888 e hospedado no GitHub. Ele se baseia no modelo Whisper da OpenAI e combina a arquitetura sem servidor do Cloudflare Workers para fornecer uma conversão de voz em texto altamente eficiente...
Spokenly: uma ferramenta de conversão de voz em texto para macOS
O Spokenly é uma ferramenta de conversão de voz em texto projetada para o macOS, criada para ajudar os usuários a digitar rapidamente o texto por voz e melhorar a eficiência do trabalho. Ele utiliza tecnologias avançadas de IA (como Whisper e GPT-4o) para converter a fala em texto em tempo real, com suporte para mais de 100 idiomas e adequado para uma ampla variedade de cenários. ....
Vibe Musicing: gerador de música com IA (gratuito, on-line)
O Vibe Musicing é um gerador de música com IA on-line gratuito que permite que todos criem rapidamente suas próprias músicas originais sem a necessidade de uma base musical. Os usuários podem escolher o estilo musical, preencher as letras ou deixar que a IA gere automaticamente as letras para personalizar facilmente a melodia, o ritmo e a atmosfera de acordo com suas necessidades.
AI Song Creator: ferramenta de IA para transformar rapidamente textos em músicas originais de alta qualidade
O AI Song Creator é uma plataforma on-line de geração de música com IA que permite aos usuários gerar músicas e letras originais de qualidade profissional em 30 a 90 segundos, inserindo uma descrição de texto ou letra. O site suporta mais de 40 estilos musicais, incluindo música eletrônica de dança, lo-fi, clássica e K-Pop, e é adequado para criadores de conteúdo, turistas ....
OpenWispr: aplicativo de desktop de fala para texto que prioriza a privacidade
O OpenWispr é um aplicativo de desktop de código aberto de conversão de fala em texto baseado na tecnologia OpenAI Whisper que converte rapidamente a fala do usuário em texto. Ele oferece opções de processamento local e em nuvem, com ênfase na proteção da privacidade, e os dados podem ser deixados totalmente locais. Os usuários podem iniciar rapidamente o ditado por meio de teclas de atalho globais, e o texto é automaticamente...
TEN: uma ferramenta de código aberto para criar inteligências de IA de fala multimodal em tempo real
O TEN Framework é uma plataforma de software de código aberto focada em ajudar os desenvolvedores a criar inteligências de IA de fala em tempo real, multimodais e de baixa latência. Ele é compatível com várias linguagens de programação, incluindo C, C++, Go, Python, JavaScript e TypeScript. Os desenvolvedores podem usar o TEN Framework para criar rapidamente fala, visão .....
Zaia Health: o assistente de voz com IA que monitora e melhora os hábitos de saúde
O Zaia Health é um aplicativo de saúde com inteligência artificial centrado em um assistente de voz chamado Zaia. O aplicativo foi desenvolvido para ajudar os usuários a se concentrarem e melhorarem seus hábitos de saúde. Ele atua como um companheiro pessoal de saúde por meio da interação de voz, orientando os usuários sobre sono, exercícios, nutrição e saúde mental...
FineShare: uma ferramenta de criação para gerar voz e música de IA
O FineShare é uma plataforma focada em tecnologia de áudio e vídeo com IA, oferecendo uma variedade de ferramentas para ajudar os usuários a criar conteúdo de voz, música e vídeo de alta qualidade. Os principais produtos do site incluem FineVoice, Singify e FineCam para geração e conversão de voz, criação de música com IA e câmera virtual...
SpleeterGui: ferramenta fácil de separação de faixas de música
O SpleeterGui é um aplicativo de desktop para usuários do Windows, baseado no Spleeter, uma biblioteca de separação de músicas de código aberto desenvolvida pela Deezer. Com uma interface gráfica simples, ele permite que o usuário separe arquivos de música em várias faixas, como vocais, bateria, baixo etc., sem precisar usar a linha de comando. Os usuários podem...
CyberSmart: conversão de texto em fala e vídeo humano digital
O Xunfei Zhizuo é uma plataforma desenvolvida pela Xunfei para fornecer serviços de criação de conteúdo de inteligência artificial. Sua principal função é converter o texto inserido pelo usuário em fala, um processo geralmente chamado de "dublagem de IA" ou "síntese de fala". Os usuários podem escolher entre uma variedade de vozes virtuais predefinidas (ou seja, "âncoras")...
Any2Text: ferramenta de IA gratuita para conversão de áudio e vídeo em texto
O Any2Text é uma ferramenta on-line gratuita que se concentra na conversão rápida de arquivos de áudio e vídeo em texto. Utiliza tecnologia avançada de reconhecimento de fala com IA, suporta mais de 100 idiomas e é adequada para uma variedade de cenários, como gravação de reuniões, transcrição de podcasts e geração de legendas. Os usuários não precisam se registrar para usá-lo, e é fácil de operar...
Parrot TTS: uma ferramenta de leitura que transforma texto da Web em fala natural
O Parrot TTS é uma extensão do Chrome projetada para converter texto da Web em fala natural. Ela usa tecnologia avançada de IA para proporcionar uma experiência de voz quase humana, resolvendo o problema das ferramentas tradicionais de conversão de texto em fala que soam mecânicas. Os usuários podem converter artigos, notícias ou materiais de pesquisa com um clique...
Wavel AI: uma ferramenta para geração rápida de dublagem e legendagem de vídeos multilíngues
A Wavel AI é uma plataforma baseada em IA focada em ajudar os usuários a criar e localizar rapidamente o conteúdo de vídeo. Ela facilita a criação de conteúdo multilíngue de vídeo e áudio por meio de recursos como clonagem de voz, conversão de texto em fala e geração automática de legendas. A plataforma é compatível com mais de 70 idiomas e oferece mais de 1.000...
wukong-robot: um projeto de alto-falante inteligente para criar um diálogo de voz personalizado em chinês
O wukong-robot é um robô de diálogo de voz em chinês de código aberto e um projeto de alto-falante inteligente, projetado para ajudar os desenvolvedores a criar rapidamente alto-falantes inteligentes personalizados. Ele é compatível com reconhecimento de fala em chinês, síntese de fala e função de diálogo em várias rodadas, integrado com ChatGPT, Baidu, KDDI e outras tecnologias. O projeto foi desenvolvido para ser modular,...
voltar ao topo