Smart Dictation:集转录、翻译和总结功能于一体的AI音频处理工具
Smart Dictation 是一款强大的macOS应用程序,它利用先进的人工智能技术,帮助用户轻松地将音频录音转换成文字。该应用集成了OpenAI最新的GPT-4o和Whisper模型,能够提供准确的转录、翻译和摘要服务。无论是在记.....
Voquill:把语音转成文字的浏览器插件
Voquill是一个安装在Chrome浏览器的AI工具。它让用户可以在任何网站上用语音输入代替键盘打字。当你在写邮件、回复聊天消息或者编辑文档时,可以直接说话,Voquill会把你的语音实时转换成文字。除了基础的语音听...
Grabcube:免费下载视频与AI转录翻译工具
Grabcube 是一个免费的音视频处理工具,专注于视频和音频下载、AI语音转文字、字幕翻译与编辑。它支持超过1000个主流平台,包括YouTube、Bilibili、Vimeo等,允许用户无限制下载多种格式的视频和音频文件。Grabcu....
Kitten-TTS-Server:一个可自行部署的轻量级文本转语音服务
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一...
AI-Chatbox:基于ESP32S3的语音转文字智能对话项目
AI-Chatbox 是一个基于 ESP32S3 开发板的语音交互项目。用户通过语音与大模型(LLM)对话,设备将语音转为文字,发送给大模型,获取回答后可进一步转为语音播报。项目使用 Rust 语言开发,集成了 Vosk 语音识别工...
Whisper on Cloudflare AI:将音频转文字并生成字幕的免费工具
Whisper_Cloudflare 是一个由开发者 thun888 创建的开源项目,托管于 GitHub。它基于 OpenAI 的 Whisper 模型,结合 Cloudflare Workers 的无服务器架构,提供高效的语音转文字功能...
Spokenly:macOS语音转文字工具
Spokenly 是一款专为 macOS 设计的语音转文字工具,旨在帮助用户通过语音快速输入文字,提高工作效率。它利用先进的 AI 技术(如 Whisper 和 GPT-4o)将语音实时转换为文字,支持超过 100 种语言,适合多种场景,....
Vibe Musicing:AI音乐生成器(免费,在线)
Vibe Musicing 是一个免费在线AI音乐生成器,无需音乐基础,人人都能快速创作属于自己的原创歌曲。用户可以根据自己的需求选择音乐风格、填写歌词,或让AI自动生成歌词,轻松定制旋律、节奏和氛围。Vibe Musicing...
AI Song Creator:快速将文本转为高品质原创音乐的AI工具
AI Song Creator 是一个在线 AI 音乐生成平台,用户通过输入文本描述或歌词,可在 30-90 秒内生成专业品质的原创音乐和歌词。网站支持 40 多种音乐风格,包括电子舞曲、Lo-Fi、古典和 K-Pop,适合内容创作者、游....
OpenWispr:隐私优先的语音转文字桌面应用
OpenWispr 是一款开源的桌面语音转文字应用,基于 OpenAI Whisper 技术,将用户语音快速转换为文本。它提供本地和云端处理选项,强调隐私保护,数据可完全留存在本地。用户通过全局热键快速启动听写,文本自动粘...
TEN:构建实时多模态语音AI智能体的开源工具
TEN框架是一个开源的软件平台,专注于帮助开发者构建实时、多模态、低延迟的语音AI智能体。它支持多种编程语言,包括C、C++、Go、Python、JavaScript和TypeScript。开发者可以通过TEN框架快速创建具有语音、视觉.....
Zaia Health:监控并改善健康习惯的AI语音助手
Zaia Health是一款人工智能健康应用,它的核心是一个名为“Zaia”的语音助手。 这款应用旨在帮助用户关注并改善自己的健康习惯。 它通过语音交互的方式,像一个私人健康伴侣一样,引导用户在睡眠、锻炼、营养和心理...
FineShare:生成AI语音和音乐的创作工具
FineShare 是一个专注于 AI 音频和视频技术的平台,提供多种工具帮助用户创建高质量的语音、音乐和视频内容。网站的核心产品包括 FineVoice、Singify 和 FineCam,分别用于语音生成与转换、AI 音乐创作和虚拟摄像...
SpleeterGui:简易音乐音轨分离工具
SpleeterGui 是一个为 Windows 用户设计的桌面应用程序,基于 Deezer 开发的开源音乐分离库 Spleeter。它通过简单的图形界面,让用户无需使用命令行即可将音乐文件分离成多个音轨,如人声、鼓、贝斯等。用户可以...
讯飞智作:将文字转换成语音和数字人视频
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择...
Any2Text:免费转换音频和视频为文本的AI工具
Any2Text 是一个免费的在线工具,专注于将音频和视频文件快速转换为文本。它利用先进的AI语音识别技术,支持超过100种语言,适合多种场景,如会议记录、播客转录和字幕生成。用户无需注册即可使用,操作简单,上...
Parrot TTS:将网页文本转为自然语音的阅读工具
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转...
Wavel AI:快速生成多语言视频配音和字幕的工具
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种...
wukong-robot:打造个性化中文语音对话的智能音箱项目
wukong-robot 是一个开源的中文语音对话机器人和智能音箱项目,旨在帮助开发者快速构建个性化的智能音箱。它支持中文语音识别、语音合成和多轮对话功能,集成了ChatGPT、百度、科大讯飞等技术。项目设计模块化,...
回顶部