
Smart Dictation: an AI audio processing tool that combines transcription, translation and summarization features
Smart Dictation 是一款强大的macOS应用程序,它利用先进的人工智能技术,帮助用户轻松地将音频录音转换成文字。该应用集成了OpenAI最新的GPT-4o和Whisper模型,能够提供准确的转录、翻译和摘要服务。无论是在记录会...

Voquill: Browser Plugin for Converting Speech to Text
Voquill是一个安装在Chrome浏览器的AI工具。它让用户可以在任何网站上用语音输入代替键盘打字。当你在写邮件、回复聊天消息或者编辑文档时,可以直接说话,Voquill会把你的语音实时转换成文字。除了基础的语音听写,这个工具还提供一个...

Grabcube: free download video with AI transcription and translation tool
Grabcube 是一个免费的音视频处理工具,专注于视频和音频下载、AI语音转文字、字幕翻译与编辑。它支持超过1000个主流平台,包括YouTube、Bilibili、Vimeo等,允许用户无限制下载多种格式的视频和音频文件。Grabcub...

Kitten-TTS-Server: a self-deployable lightweight text-to-speech service
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一个直观的网页...

AI-Chatbox: Speech-to-Text Intelligent Dialogue Project based on ESP32S3
AI-Chatbox 是一个基于 ESP32S3 开发板的语音交互项目。用户通过语音与大模型(LLM)对话,设备将语音转为文字,发送给大模型,获取回答后可进一步转为语音播报。项目使用 Rust 语言开发,集成了 Vosk 语音识别工具,适合...

Whisper on Cloudflare AI: a free tool to convert audio to text and generate subtitles
Whisper_Cloudflare is an open source project created by developer thun888 and hosted on GitHub.It is based on OpenAI's Whisper model and combines the serverless architecture of Cloudflare Workers to provide highly efficient speech-to-text...

Spokenly: a speech-to-text tool for macOS
Spokenly 是一款专为 macOS 设计的语音转文字工具,旨在帮助用户通过语音快速输入文字,提高工作效率。它利用先进的 AI 技术(如 Whisper 和 GPT-4o)将语音实时转换为文字,支持超过 100 种语言,适合多种场景,如...

Vibe Musicing: AI music generator (free, online)
Vibe Musicing 是一个免费在线AI音乐生成器,无需音乐基础,人人都能快速创作属于自己的原创歌曲。用户可以根据自己的需求选择音乐风格、填写歌词,或让AI自动生成歌词,轻松定制旋律、节奏和氛围。Vibe Musicing 支持多种音...

AI Song Creator: AI tool to quickly turn text into high-quality original music
AI Song Creator 是一个在线 AI 音乐生成平台,用户通过输入文本描述或歌词,可在 30-90 秒内生成专业品质的原创音乐和歌词。网站支持 40 多种音乐风格,包括电子舞曲、Lo-Fi、古典和 K-Pop,适合内容创作者、游戏...

OpenWispr: Privacy-First Speech-to-Text Desktop Application
OpenWispr 是一款开源的桌面语音转文字应用,基于 OpenAI Whisper 技术,将用户语音快速转换为文本。它提供本地和云端处理选项,强调隐私保护,数据可完全留存在本地。用户通过全局热键快速启动听写,文本自动粘贴至光标位置,适合...

TEN: An open source tool for building real-time multimodal speech AI intelligences
TEN框架是一个开源的软件平台,专注于帮助开发者构建实时、多模态、低延迟的语音AI智能体。它支持多种编程语言,包括C、C++、Go、Python、JavaScript和TypeScript。开发者可以通过TEN框架快速创建具有语音、视觉和文...

Zaia Health: the AI voice assistant that monitors and improves health habits
Zaia Health是一款人工智能健康应用,它的核心是一个名为“Zaia”的语音助手。 这款应用旨在帮助用户关注并改善自己的健康习惯。 它通过语音交互的方式,像一个私人健康伴侣一样,引导用户在睡眠、锻炼、营养和心理健康等方面养成更规律的生...

FineShare: an authoring tool for generating AI speech and music
FineShare is a platform focused on AI audio and video technology, offering a variety of tools to help users create high-quality voice, music and video content. The site's core products include FineVoice, Singify, and FineCam for speech generation and conversion, AI music creation, and virtual camera...

SpleeterGui: Easy Music Track Separation Tool
SpleeterGui 是一个为 Windows 用户设计的桌面应用程序,基于 Deezer 开发的开源音乐分离库 Spleeter。它通过简单的图形界面,让用户无需使用命令行即可将音乐文件分离成多个音轨,如人声、鼓、贝斯等。用户可以轻松上...

CyberSmart: Converting Text to Speech and Digital Human Video
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择,这些声音具有不同的风格,比如新闻播...

Any2Text: Free AI tool for converting audio and video to text
Any2Text 是一个免费的在线工具,专注于将音频和视频文件快速转换为文本。它利用先进的AI语音识别技术,支持超过100种语言,适合多种场景,如会议记录、播客转录和字幕生成。用户无需注册即可使用,操作简单,上传文件后即可获得高精度的文本结...

Parrot TTS: a reading tool that turns web text into natural speech
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转为音频,适合多任务处...

Wavel AI: A Tool for Rapidly Generating Multilingual Video Dubbing and Subtitling
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种逼真语音,适合内容创作者...

wukong-robot: a smart speaker project to create personalized Chinese voice conversations
wukong-robot 是一个开源的中文语音对话机器人和智能音箱项目,旨在帮助开发者快速构建个性化的智能音箱。它支持中文语音识别、语音合成和多轮对话功能,集成了ChatGPT、百度、科大讯飞等技术。项目设计模块化,插件和功能可自由扩展,适...
Top