
Smart Dictation: ein KI-Audioverarbeitungstool, das Transkriptions-, Übersetzungs- und Zusammenfassungsfunktionen kombiniert
Smart Dictation 是一款强大的macOS应用程序,它利用先进的人工智能技术,帮助用户轻松地将音频录音转换成文字。该应用集成了OpenAI最新的GPT-4o和Whisper模型,能够提供准确的转录、翻译和摘要服务。无论是在记录会...

Voquill: Browser-Plugin, das Sprache in Text umwandelt
Voquill是一个安装在Chrome浏览器的AI工具。它让用户可以在任何网站上用语音输入代替键盘打字。当你在写邮件、回复聊天消息或者编辑文档时,可以直接说话,Voquill会把你的语音实时转换成文字。除了基础的语音听写,这个工具还提供一个...

Grabcube: kostenloser Download von Videos mit KI-Transkriptions- und Übersetzungstool
Grabcube 是一个免费的音视频处理工具,专注于视频和音频下载、AI语音转文字、字幕翻译与编辑。它支持超过1000个主流平台,包括YouTube、Bilibili、Vimeo等,允许用户无限制下载多种格式的视频和音频文件。Grabcub...

Kitten-TTS-Server: Ein selbstentwickelbarer, leichtgewichtiger Text-to-Speech-Dienst
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一个直观的网页...

AI-Chatbox: ESP32S3-basiertes Projekt für intelligenten Dialog von Sprache zu Text
AI-Chatbox 是一个基于 ESP32S3 开发板的语音交互项目。用户通过语音与大模型(LLM)对话,设备将语音转为文字,发送给大模型,获取回答后可进一步转为语音播报。项目使用 Rust 语言开发,集成了 Vosk 语音识别工具,适合...

Whisper auf Cloudflare AI: ein kostenloses Tool zur Umwandlung von Audio in Text und zur Erstellung von Untertiteln
Whisper_Cloudflare ist ein Open-Source-Projekt des Entwicklers thun888, das auf GitHub gehostet wird. Es basiert auf dem Whisper-Modell von OpenAI und kombiniert die serverlose Architektur von Cloudflare Workers, um eine hocheffiziente Sprache-zu-Text...

Spokenly: ein Sprache-zu-Text-Tool für macOS
Spokenly 是一款专为 macOS 设计的语音转文字工具,旨在帮助用户通过语音快速输入文字,提高工作效率。它利用先进的 AI 技术(如 Whisper 和 GPT-4o)将语音实时转换为文字,支持超过 100 种语言,适合多种场景,如...

Vibe Musicing: KI-Musikgenerator (kostenlos, online)
Vibe Musicing 是一个免费在线AI音乐生成器,无需音乐基础,人人都能快速创作属于自己的原创歌曲。用户可以根据自己的需求选择音乐风格、填写歌词,或让AI自动生成歌词,轻松定制旋律、节奏和氛围。Vibe Musicing 支持多种音...

AI Song Creator: KI-Tool zur schnellen Umwandlung von Text in hochwertige Originalmusik
AI Song Creator 是一个在线 AI 音乐生成平台,用户通过输入文本描述或歌词,可在 30-90 秒内生成专业品质的原创音乐和歌词。网站支持 40 多种音乐风格,包括电子舞曲、Lo-Fi、古典和 K-Pop,适合内容创作者、游戏...

OpenWispr: Datenschutzgerechte Speech-to-Text Desktop-Anwendung
OpenWispr 是一款开源的桌面语音转文字应用,基于 OpenAI Whisper 技术,将用户语音快速转换为文本。它提供本地和云端处理选项,强调隐私保护,数据可完全留存在本地。用户通过全局热键快速启动听写,文本自动粘贴至光标位置,适合...

TEN: Ein Open-Source-Tool zur Entwicklung multimodaler Sprach-KI-Intelligenzen in Echtzeit
TEN框架是一个开源的软件平台,专注于帮助开发者构建实时、多模态、低延迟的语音AI智能体。它支持多种编程语言,包括C、C++、Go、Python、JavaScript和TypeScript。开发者可以通过TEN框架快速创建具有语音、视觉和文...

Zaia Health: der KI-Sprachassistent, der Gesundheitsgewohnheiten überwacht und verbessert
Zaia Health是一款人工智能健康应用,它的核心是一个名为“Zaia”的语音助手。 这款应用旨在帮助用户关注并改善自己的健康习惯。 它通过语音交互的方式,像一个私人健康伴侣一样,引导用户在睡眠、锻炼、营养和心理健康等方面养成更规律的生...

FineShare: ein Authoring-Tool zur Erzeugung von KI-Stimme und -Musik
FineShare ist eine Plattform, die sich auf KI-Audio- und -Videotechnologie konzentriert und eine Vielzahl von Tools anbietet, mit denen Nutzer hochwertige Sprach-, Musik- und Videoinhalte erstellen können. Zu den Kernprodukten der Website gehören FineVoice, Singify und FineCam für die Spracherzeugung und -konvertierung, die KI-Musikproduktion und die virtuelle Kamera...

SpleeterGui: Einfaches Werkzeug zum Trennen von Musikstücken
SpleeterGui 是一个为 Windows 用户设计的桌面应用程序,基于 Deezer 开发的开源音乐分离库 Spleeter。它通过简单的图形界面,让用户无需使用命令行即可将音乐文件分离成多个音轨,如人声、鼓、贝斯等。用户可以轻松上...

CyberSmart: Umwandlung von Text in Sprache und Digital Human Video
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择,这些声音具有不同的风格,比如新闻播...

Any2Text: kostenloses AI-Tool zur Umwandlung von Audio und Video in Text
Any2Text 是一个免费的在线工具,专注于将音频和视频文件快速转换为文本。它利用先进的AI语音识别技术,支持超过100种语言,适合多种场景,如会议记录、播客转录和字幕生成。用户无需注册即可使用,操作简单,上传文件后即可获得高精度的文本结...

Parrot TTS: ein Lesetool, das Webtexte in natürliche Sprache umwandelt
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转为音频,适合多任务处...

Wavel AI: Ein Tool für die schnelle Erstellung mehrsprachiger Videosynchronisation und Untertitelung
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种逼真语音,适合内容创作者...

wukong-robot: ein Projekt für intelligente Lautsprecher zur Erstellung personalisierter chinesischer Sprachdialoge
wukong-robot 是一个开源的中文语音对话机器人和智能音箱项目,旨在帮助开发者快速构建个性化的智能音箱。它支持中文语音识别、语音合成和多轮对话功能,集成了ChatGPT、百度、科大讯飞等技术。项目设计模块化,插件和功能可自由扩展,适...
zurück zum Anfang