Kitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantável
O Kitten-TTS-Server é um projeto de código aberto que fornece um servidor com recursos aprimorados para o modelo leve KittenTTS. Os usuários podem usar esse projeto para criar seu próprio serviço de conversão de texto em fala (TTS). A principal vantagem desse projeto é que ele se baseia no modelo original, acrescentando um ...
FineShare: uma ferramenta de criação para gerar voz e música de IA
O FineShare é uma plataforma focada em tecnologia de áudio e vídeo com IA, oferecendo uma variedade de ferramentas para ajudar os usuários a criar conteúdo de voz, música e vídeo de alta qualidade. Os principais produtos do site incluem FineVoice, Singify e FineCam para geração e conversão de voz, criação de música com IA e câmera virtual...
CyberSmart: conversão de texto em fala e vídeo humano digital
O Xunfei Zhizuo é uma plataforma desenvolvida pela Xunfei para fornecer serviços de criação de conteúdo de inteligência artificial. Sua principal função é converter o texto inserido pelo usuário em fala, um processo geralmente chamado de "dublagem de IA" ou "síntese de fala". Os usuários podem escolher entre uma variedade de vozes virtuais predefinidas (ou seja, "âncoras")...
Parrot TTS: uma ferramenta de leitura que transforma texto da Web em fala natural
O Parrot TTS é uma extensão do Chrome projetada para converter texto da Web em fala natural. Ela usa tecnologia avançada de IA para proporcionar uma experiência de voz quase humana, resolvendo o problema das ferramentas tradicionais de conversão de texto em fala que soam mecânicas. Os usuários podem converter artigos, notícias ou materiais de pesquisa com um clique...
Wavel AI: uma ferramenta para geração rápida de dublagem e legendagem de vídeos multilíngues
A Wavel AI é uma plataforma baseada em IA focada em ajudar os usuários a criar e localizar rapidamente o conteúdo de vídeo. Ela facilita a criação de conteúdo multilíngue de vídeo e áudio por meio de recursos como clonagem de voz, conversão de texto em fala e geração automática de legendas. A plataforma é compatível com mais de 70 idiomas e oferece mais de 1.000...
AIVocal: uma ferramenta de IA gratuita para gerar podcasts e processar áudio
O AIVocal é uma plataforma de processamento de áudio de IA gratuita que oferece conversão de texto em fala (TTS), conversão de fala em texto (STT), separação de voz humana e geração de podcast. Os usuários podem usá-la sem registro, e ela suporta 24 idiomas e mais de 900 tons naturais, o que é adequado para a produção de podcasts, audiolivros, dublagem de vídeo e assim por diante....
Dia: um modelo de conversão de texto em fala para gerar diálogos hiper-realistas para vários jogadores
O Dia é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pela Nari Labs que se concentra na geração de áudio de diálogo hiper-realista. Ele transforma scripts de texto em diálogos realistas com vários caracteres em um único processo, oferece suporte ao controle de emoções e entonação e até mesmo gera expressões não verbais, como risadas.
MiniMax Audio (Conch Speech): ferramenta de IA para gerar discurso natural
O MiniMax Audio é uma ferramenta de geração de fala de IA da MiniMax, com o recurso principal de converter rapidamente texto em fala natural altamente semelhante. Ela se baseia no modelo Speech-02, com uma similaridade de síntese de fala de até 99%, qualidade de som de nível de estúdio e suporte para mais de 30 idiomas e uma ampla variedade de...
Text2Voice: uma interface gráfica de conversão de texto em fala baseada em APIs de fluxo baseadas em silício
O Text2Voice é uma ferramenta de código aberto que fornece funcionalidade de conversão de texto em fala com base em uma API de mobilidade baseada em silício, com uma interface gráfica do usuário (GUI) limpa como seu melhor recurso. Ele foi criado pelo desenvolvedor Sheldon Lee no GitHub para permitir que os usuários transformem facilmente texto em fala por meio de uma interface. O projeto usa o Py...
Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala
O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas, pode converter texto em fala natural e clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniM...
Mureka: uma ferramenta de música original gerada por IA da Kunlun
A Mureka é uma plataforma de geração de música com IA criada pela empresa chinesa Kunlun World Wide, que entrou em operação em agosto de 2024 e rapidamente ganhou atenção no exterior devido à sua excelente qualidade de som e simplicidade de operação. Em 26 de março de 2025, a Mureka lançou o primeiro macromodelo de inferência musical do mundo, o Mureka O1, e um modelo básico, o Mureka V6.
csm-mlx: modelo de geração de fala csm para dispositivos Apple
O csm-mlx é baseado na estrutura MLX desenvolvida pela Apple, otimizada para o modelo de diálogo de fala CSM (Conversation Speech Model) especificamente para o Apple Silicon. Esse projeto permite que os usuários executem uma geração de fala eficiente em dispositivos Apple de forma simples e...
Autiobooks: converter ebooks epub em audiolivros m4b
O Autiobooks é uma ferramenta de código aberto criada para ajudar os usuários a converter rapidamente livros eletrônicos no formato .epub em audiolivros no formato .m4b. Ela usa tecnologia de síntese de fala de alta qualidade fornecida pela Kokoro para produzir áudio natural e suave. A ferramenta foi desenvolvida por David Nesbitt e segue o padrão MIT ...
PlayHT: uma ferramenta de IA para gerar fala hiper-realista
A PlayHT é uma plataforma on-line eficiente que se concentra na geração de fala com IA para ajudar os usuários a converter rapidamente o texto em uma fala natural e realista. Ela oferece mais de 600 vozes de IA, suporta mais de 60 idiomas e diversos sotaques e é adequada para uma variedade de cenários, como produção de podcast, conteúdo educacional, marketing e promoção. Os usuários só precisam inserir...
Spark-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural
O Spark-TTS é uma ferramenta de conversão de texto em fala (TTS) de código aberto desenvolvida pela equipe do SparkAudio, hospedada no GitHub, projetada para ajudar os usuários a converter texto em fala natural e suave com eficiência. Ela se baseia em tecnologia avançada de aprendizagem profunda e oferece suporte a vários idiomas e estilos de voz...
Azure TTS Importer: Integrando serviços de síntese de fala ao software de leitura
O TTS Importer é um projeto de código aberto desenvolvido para importar facilmente os serviços de síntese de fala do Azure TTS (Text-to-Speech) para vários softwares de leitura. A ferramenta é compatível com vários softwares de leitura populares, incluindo o Read (legado), o Love Reader, o Source Reader e outros. Com o TTS Importe...
Kokoro WebGPU: um serviço de conversão de texto em fala para operação off-line em navegadores
O Kokoro WebGPU é uma versão WebGPU do modelo de conversão de texto em fala (TTS) Kokoro, fornecido pela WebML Community na plataforma Hugging Face. O projeto utiliza a tecnologia WebGPU para permitir que os usuários executem conversões eficientes de texto para fala localmente em seus navegadores.
Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes
O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido por thewh1teagle, o projeto tem como objetivo fornecer uma solução de síntese de fala rápida e eficiente. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, e está planejado para ser compatível com francês, japonês, coreano e chinês...
OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI
O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.
voltar ao topo