
Kitten-TTS-Server: Ein selbstentwickelbarer, leichtgewichtiger Text-to-Speech-Dienst
Kitten-TTS-Server 是一个开源项目,它为轻量级的 KittenTTS 模型提供了一个功能增强的服务器。用户可以通过这个项目自己搭建一个文本转语音(TTS)服务。这个项目的核心优势在于它在原始模型的基础上,增加了一个直观的网页...

FineShare: ein Authoring-Tool zur Erzeugung von KI-Stimme und -Musik
FineShare ist eine Plattform, die sich auf KI-Audio- und -Videotechnologie konzentriert und eine Vielzahl von Tools anbietet, mit denen Nutzer hochwertige Sprach-, Musik- und Videoinhalte erstellen können. Zu den Kernprodukten der Website gehören FineVoice, Singify und FineCam für die Spracherzeugung und -konvertierung, die KI-Musikproduktion und die virtuelle Kamera...

CyberSmart: Umwandlung von Text in Sprache und Digital Human Video
讯飞智作是科大讯飞公司开发的一个提供人工智能内容创作服务的平台。它的核心功能是将用户输入的文字转换成语音,这个过程通常被称为“AI配音”或“语音合成”。用户可以从多种预设的虚拟声音(即“主播”)中进行选择,这些声音具有不同的风格,比如新闻播...

Parrot TTS: ein Lesetool, das Webtexte in natürliche Sprache umwandelt
Parrot TTS 是一款 Chrome 浏览器扩展程序,专为将网页文本转化为自然语音设计。它使用先进的 AI 技术,提供接近人类的声音体验,解决传统文本转语音工具听起来机械的问题。用户可以一键将文章、新闻或研究资料转为音频,适合多任务处...

Wavel AI: Ein Tool für die schnelle Erstellung mehrsprachiger Videosynchronisation und Untertitelung
Wavel AI 是一个基于人工智能的平台,专注于帮助用户快速创建和本地化视频内容。它通过语音克隆、文本转语音和自动字幕生成等功能,让用户轻松制作多语言视频和音频内容。平台支持超过 70 种语言,提供 1000 多种逼真语音,适合内容创作者...

AIVocal: ein kostenloses KI-Tool zur Erstellung von Podcasts und zur Audiobearbeitung
AIVocal 是一个免费的 AI 音频处理平台,提供文本转语音(TTS)、语音转文本(STT)、人声分离和播客生成等功能。用户无需注册即可使用,支持 24 种语言和 900 多种自然音色,适合制作播客、有声书、视频配音等。平台界面直观,操...

Dia: ein Text-to-Speech-Modell zur Erzeugung hyperrealistischer Multiplayer-Dialoge
Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表达,如笑声。Dia 的核心是 16 亿参数的模型,...

MiniMax Audio (Conch Speech): KI-Tool zur Erzeugung natürlicher Sprache
MiniMax Audio ist ein KI-Spracherzeugungstool von MiniMax, dessen Hauptfunktion die schnelle Umwandlung von Text in sehr ähnliche natürliche Sprache ist. Es basiert auf dem Modell Speech-02, mit einer Sprachsynthese Ähnlichkeit von bis zu 99%, Studio-Qualität, und Unterstützung für mehr als 30 Sprachen und eine breite Palette von Mund...

Text2Voice: eine grafische Text-zu-Sprache-Schnittstelle auf der Grundlage von Silizium-basierten Flow-APIs
Text2Voice ist ein Open-Source-Tool, das Text-zu-Sprache-Funktionen auf der Grundlage einer siliziumbasierten Mobilitäts-API bietet und sich durch eine übersichtliche grafische Benutzeroberfläche (GUI) auszeichnet. Es wurde vom Entwickler Sheldon Lee auf GitHub erstellt, um Benutzern die einfache Umwandlung von Text in Sprache über eine Schnittstelle zu ermöglichen. Das Projekt verwendet Py...

Operatives Open-Source-Projekt, das mehrere fortschrittliche Sprachsynthesedienste integriert
Open-VoiceCanvas ist eine Open-Source-Plattform für Sprachsynthese, die vom ItusiAI-Team entwickelt wurde. Sie unterstützt mehr als 50 Sprachen, wandelt Text in natürliche Sprache um und ermöglicht es Ihnen, eine personalisierte Stimme zu klonen, indem Sie Audio hochladen. Das Projekt integriert OpenAI TTS, AWS Polly und MiniM...

Mureka: ein KI-generiertes Werkzeug für Originalmusik von Kunlun
Mureka ist eine KI-Musikgenerierungsplattform des chinesischen Unternehmens Kunlun World Wide, die im August 2024 in Betrieb genommen wurde und aufgrund ihrer ausgezeichneten Klangqualität und einfachen Bedienung schnell Aufmerksamkeit in Übersee erlangte. Am 26. März 2025 brachte Mureka das weltweit erste Musikinferenz-Makromodell, Mureka O1, und ein Basismodell, Mureka V6, auf den Markt...

csm-mlx: csm-Sprachgenerierungsmodell für Apple-Geräte
csm-mlx basiert auf dem von Apple entwickelten MLX-Framework, das für das Sprachdialogmodell CSM (Conversation Speech Model) speziell für Apple Silicon optimiert wurde. Dieses Projekt ermöglicht es Benutzern, effiziente Spracherzeugung auf Apple-Geräten auf einfache Art und Weise...

Autiobooks: epub ebooks in m4b-Hörbücher umwandeln
Autiobooks ist ein Open-Source-Tool, das Benutzern helfen soll, eBooks im .epub-Format schnell in Hörbücher im .m4b-Format zu konvertieren. Es verwendet die hochwertige Sprachsynthesetechnologie von Kokoro, um ein natürliches und flüssiges Audio zu erzeugen. Das Tool wurde von David Nesbitt entwickelt und folgt dem MIT ...

PlayHT: ein KI-Tool zur Erzeugung hyperrealistischer Sprache
PlayHT 是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。用户只需输入文本,选择合适的语音风格,...

Spark-TTS: Ein Text-to-Speech-Werkzeug zur Erzeugung natürlicher Sprache
Spark-TTS ist ein Open-Source-Tool für Text-to-Speech (TTS), das vom SparkAudio-Team entwickelt wurde und auf GitHub gehostet wird. Es wurde entwickelt, um Benutzern zu helfen, Text effizient in natürliche und flüssige Sprache umzuwandeln. Es basiert auf fortschrittlicher Deep-Learning-Technologie und unterstützt mehrere Sprachen und Sprachstile...

Azure TTS Importer: Integration von Sprachsynthesediensten in Lesesoftware
TTS Importer ist ein Open-Source-Projekt, das den einfachen Import von Azure TTS (Text-to-Speech) Sprachsynthesediensten in verschiedene Lesesoftware ermöglicht. Das Tool unterstützt mehrere beliebte Lesesoftware, einschließlich Read (legado), Love Reader, Source Reader und mehr. Mit TTS Importe...

Kokoro WebGPU: Ein Text-to-Speech-Dienst für den Offline-Betrieb in Browsern
Kokoro WebGPU ist eine WebGPU-Version des Kokoro Text-to-Speech (TTS)-Modells, das von der WebML Community auf der Hugging Face-Plattform bereitgestellt wird. Das Projekt nutzt die WebGPU-Technologie, um Benutzern die Möglichkeit zu geben, effiziente Text-zu-Sprache-Konvertierungen lokal in ihren Browsern auszuführen...

Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und Stimmen
Kokoro-ONNX ist ein quelloffenes Text-to-Speech (TTS)-Tool, das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle, zielt das Projekt darauf ab, eine effiziente und schnelle Sprachsyntheselösung zu bieten. Kokoro-ONNX unterstützt mehrere Sprachen, einschließlich Englisch, und ist geplant, Französisch, Japanisch, Koreanisch und Chinesisch zu unterstützen...

OpenAI Edge TTS: Freie Text-to-Speech-API mit Edge TTS, kompatibel mit OpenAI-Formaten
OpenAI Edge TTS ist ein Open-Source-Projekt, das eine native, mit OpenAI kompatible Text-to-Speech (TTS)-API bereitstellt. Das Projekt nutzt den Online-Text-to-Speech-Dienst von Microsoft Edge, um Benutzern die Erzeugung hochwertiger Sprachausgabe zu ermöglichen...
zurück zum Anfang