
Kitten-TTS-Server: um serviço de conversão de texto em fala leve e autoimplantável
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一个直观的网页...

FineShare: uma ferramenta de criação para gerar voz e música de IA
O FineShare é uma plataforma focada em tecnologia de áudio e vídeo com IA, oferecendo uma variedade de ferramentas para ajudar os usuários a criar conteúdo de voz, música e vídeo de alta qualidade. Os principais produtos do site incluem FineVoice, Singify e FineCam para geração e conversão de voz, criação de música com IA e câmera virtual...

CyberSmart: conversão de texto em fala e vídeo humano digital
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择,这些声音具有不同的风格,比如新闻播...

Parrot TTS: uma ferramenta de leitura que transforma texto da Web em fala natural
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转为音频,适合多任务处...

Wavel AI: uma ferramenta para geração rápida de dublagem e legendagem de vídeos multilíngues
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种逼真语音,适合内容创作者...

AIVocal: uma ferramenta de IA gratuita para gerar podcasts e processar áudio
AIVocal 是一个免费的 AI 音频处理平台,提供文本转语音(TTS)、语音转文本(STT)、人声分离和播客生成等功能。用户无需注册即可使用,支持 24 种语言和 900 多种自然音色,适合制作播客、有声书、视频配音等。平台界面直观,操...

Dia: um modelo de conversão de texto em fala para gerar diálogos hiper-realistas para vários jogadores
Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表达,如笑声。Dia 的核心是 16 亿参数的模型,...

MiniMax Audio (Conch Speech): ferramenta de IA para gerar discurso natural
O MiniMax Audio é uma ferramenta de geração de fala de IA da MiniMax, com o recurso principal de converter rapidamente texto em fala natural altamente semelhante. Ela se baseia no modelo Speech-02, com uma similaridade de síntese de fala de até 99%, qualidade de som de nível de estúdio e suporte para mais de 30 idiomas e uma ampla variedade de...

Text2Voice: uma interface gráfica de conversão de texto em fala baseada em APIs de fluxo baseadas em silício
O Text2Voice é uma ferramenta de código aberto que fornece funcionalidade de conversão de texto em fala com base em uma API de mobilidade baseada em silício, com uma interface gráfica do usuário (GUI) limpa como seu melhor recurso. Ele foi criado pelo desenvolvedor Sheldon Lee no GitHub para permitir que os usuários transformem facilmente texto em fala por meio de uma interface. O projeto usa o Py...

Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala
O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas, pode converter texto em fala natural e clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniM...

Mureka: uma ferramenta de música original gerada por IA da Kunlun
A Mureka é uma plataforma de geração de música com IA criada pela empresa chinesa Kunlun World Wide, que entrou em operação em agosto de 2024 e rapidamente ganhou atenção no exterior devido à sua excelente qualidade de som e simplicidade de operação. Em 26 de março de 2025, a Mureka lançou o primeiro macromodelo de inferência musical do mundo, o Mureka O1, e um modelo básico, o Mureka V6.

csm-mlx: modelo de geração de fala csm para dispositivos Apple
O csm-mlx é baseado na estrutura MLX desenvolvida pela Apple, otimizada para o modelo de diálogo de fala CSM (Conversation Speech Model) especificamente para o Apple Silicon. Esse projeto permite que os usuários executem uma geração de fala eficiente em dispositivos Apple de forma simples e...

Autiobooks: converter ebooks epub em audiolivros m4b
O Autiobooks é uma ferramenta de código aberto criada para ajudar os usuários a converter rapidamente livros eletrônicos no formato .epub em audiolivros no formato .m4b. Ela usa tecnologia de síntese de fala de alta qualidade fornecida pela Kokoro para produzir áudio natural e suave. A ferramenta foi desenvolvida por David Nesbitt e segue o padrão MIT ...

PlayHT: uma ferramenta de IA para gerar fala hiper-realista
PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用户只需输入文本,选择合适的语音风格,...

Spark-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural
O Spark-TTS é uma ferramenta de conversão de texto em fala (TTS) de código aberto desenvolvida pela equipe do SparkAudio, hospedada no GitHub, projetada para ajudar os usuários a converter texto em fala natural e suave com eficiência. Ela se baseia em tecnologia avançada de aprendizagem profunda e oferece suporte a vários idiomas e estilos de voz...

Azure TTS Importer: Integrando serviços de síntese de fala ao software de leitura
O TTS Importer é um projeto de código aberto desenvolvido para importar facilmente os serviços de síntese de fala do Azure TTS (Text-to-Speech) para vários softwares de leitura. A ferramenta é compatível com vários softwares de leitura populares, incluindo o Read (legado), o Love Reader, o Source Reader e outros. Com o TTS Importe...

Kokoro WebGPU: um serviço de conversão de texto em fala para operação off-line em navegadores
O Kokoro WebGPU é uma versão WebGPU do modelo de conversão de texto em fala (TTS) Kokoro, fornecido pela WebML Community na plataforma Hugging Face. O projeto utiliza a tecnologia WebGPU para permitir que os usuários executem conversões eficientes de texto para fala localmente em seus navegadores.

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes
O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido por thewh1teagle, o projeto tem como objetivo fornecer uma solução de síntese de fala rápida e eficiente. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, e está planejado para ser compatível com francês, japonês, coreano e chinês...

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI
O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.
voltar ao topo