Kitten-TTS-Server:一个可自行部署的轻量级文本转语音服务
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一...
FineShare:生成AI语音和音乐的创作工具
FineShare 是一个专注于 AI 音频和视频技术的平台,提供多种工具帮助用户创建高质量的语音、音乐和视频内容。网站的核心产品包括 FineVoice、Singify 和 FineCam,分别用于语音生成与转换、AI 音乐创作和虚拟摄像...
讯飞智作:将文字转换成语音和数字人视频
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择...
Parrot TTS:将网页文本转为自然语音的阅读工具
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转...
Wavel AI:快速生成多语言视频配音和字幕的工具
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种...
AIVocal:免费生成播客与处理音频的AI工具
AIVocal 是一个免费的 AI 音频处理平台,提供文本转语音(TTS)、语音转文本(STT)、人声分离和播客生成等功能。用户无需注册即可使用,支持 24 种语言和 900 多种自然音色,适合制作播客、有声书、视频配音等。...
Dia:生成超现实多人对话的文本转语音模型
Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表达,如笑声。Dia 的核心是 ...
MiniMax Audio(海螺语音):生成自然语音的AI工具
MiniMax Audio 是 MiniMax 公司推出的一款 AI 语音生成工具,核心特点是快速将文字转为高相似度的自然语音。它基于 Speech-02 模型,语音合成相似度高达 99%,音质达到录音室级别,支持超过 30 种语言和多种口...
Text2Voice:基于硅基流动API的文本转语音图形界面
Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让用户可以通过界面轻松把文字变成语音。项目使用 Py...
集成多种先进语音合成服务的开源运营项目
Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 OpenAI TTS、AWS Polly 和 MiniM...
Mureka:昆仑万维推出的AI生成原创音乐工具
Mureka 是由中国公司昆仑万维打造的AI音乐生成平台,2024年8月上线后,因音质优异、操作简单,在海外迅速受到关注。2025年3月26日,Mureka 推出全球首款音乐推理大模型 Mureka O1 和基座模型 Mureka V6。这...
csm-mlx:苹果设备专用的 csm 语音生成模型
csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用户可以用简单的方式在苹果设备上运行高效的语音生成和...
Autiobooks:将epub电子书转换为m4b有声书
Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由 David Nesbitt 开发,遵循 MIT ...
PlayHT:生成超真实语音的AI工具
PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用户只需输...
Spark-TTS:生成自然语音的文本转语音工具
Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语音。它基于先进的深度学习技术,支持多种语言和声音风...
Azure TTS Importer:将语音合成服务集成到阅读软件中
TTS Importer 是一个开源项目,旨在将 Azure TTS(Text-to-Speech)语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件,包括阅读(legado)、爱阅记、源阅读等。通过 TTS Importe...
Kokoro WebGPU:浏览器中离线运行的文本转语音服务
Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能够在浏览器中本地运行高效的文本转语音转换。WebG...
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择
Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持多种语言,包括英语,并计划支持法语、日语、韩语和中...
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式
OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多...
回顶部