Kitten-TTS-Server: Ein selbstentwickelbarer, leichtgewichtiger Text-to-Speech-Dienst
Kitten-TTS-Server ist ein Open-Source-Projekt, das einen funktionserweiterten Server für das leichtgewichtige KittenTTS-Modell bereitstellt. Benutzer können dieses Projekt verwenden, um ihre eigenen Text-to-Speech (TTS) Dienste zu erstellen. Der Hauptvorteil dieses Projekts besteht darin, dass es auf dem ursprünglichen Modell basiert und eine ...
FineShare: ein Authoring-Tool zur Erzeugung von KI-Stimme und -Musik
FineShare ist eine Plattform, die sich auf KI-Audio- und -Videotechnologie konzentriert und eine Vielzahl von Tools anbietet, mit denen Nutzer hochwertige Sprach-, Musik- und Videoinhalte erstellen können. Zu den Kernprodukten der Website gehören FineVoice, Singify und FineCam für die Spracherzeugung und -konvertierung, die KI-Musikproduktion und die virtuelle Kamera...
CyberSmart: Umwandlung von Text in Sprache und Digital Human Video
Xunfei Zhizuo ist eine von Xunfei entwickelte Plattform, die Dienste zur Erstellung von Inhalten mit künstlicher Intelligenz anbietet. Ihre Kernfunktion besteht darin, vom Benutzer eingegebenen Text in Sprache umzuwandeln, ein Prozess, der oft als "KI-Synchronisation" oder "Sprachsynthese" bezeichnet wird. Die Benutzer können aus einer Reihe von voreingestellten virtuellen Stimmen (d. h. "Ankern") wählen...
Parrot TTS: ein Lesetool, das Webtexte in natürliche Sprache umwandelt
Parrot TTS ist eine Chrome-Erweiterung, die Webtext in natürliche Sprache umwandelt. Es verwendet fortschrittliche KI-Technologie, um eine fast menschliche Stimme zu bieten, die das Problem der traditionellen Text-to-Speech-Tools löst, die mechanisch klingen. Benutzer können Artikel, Nachrichten oder Forschungsmaterialien mit einem Klick umwandeln...
Wavel AI: Ein Tool für die schnelle Erstellung mehrsprachiger Videosynchronisation und Untertitelung
Wavel AI ist eine KI-basierte Plattform, die den Nutzern helfen soll, schnell Videoinhalte zu erstellen und zu lokalisieren. Sie erleichtert den Nutzern die Erstellung mehrsprachiger Video- und Audioinhalte durch Funktionen wie das Klonen von Stimmen, Text-to-Speech und die automatische Generierung von Untertiteln. Die Plattform unterstützt über 70 Sprachen und bietet mehr als 1000...
AIVocal: ein kostenloses KI-Tool zur Erstellung von Podcasts und zur Audiobearbeitung
AIVocal ist eine kostenlose KI-Audioverarbeitungsplattform, die Text-to-Speech (TTS), Speech-to-Text (STT), menschliche Sprachseparation und Podcast-Erzeugung bietet. Benutzer können es ohne Registrierung verwenden, und es unterstützt 24 Sprachen und mehr als 900 natürliche Töne, die für die Produktion von Podcasts, Hörbüchern, Video-Synchronisation und so weiter geeignet ist....
Dia: ein Text-to-Speech-Modell zur Erzeugung hyperrealistischer Multiplayer-Dialoge
Dia ist ein von Nari Labs entwickeltes Open-Source-Text-to-Speech (TTS)-Modell, das sich auf die Erzeugung von hyperrealistischem Dialog-Audio konzentriert. Es wandelt Text-Skripte in einem einzigen Prozess in realistische Dialoge mit mehreren Zeichen um, unterstützt die Steuerung von Emotionen und Intonation und erzeugt sogar nonverbale Ausdrücke wie Lachen...
MiniMax Audio (Conch Speech): KI-Tool zur Erzeugung natürlicher Sprache
MiniMax Audio ist ein KI-Spracherzeugungstool von MiniMax, dessen Hauptfunktion die schnelle Umwandlung von Text in sehr ähnliche natürliche Sprache ist. Es basiert auf dem Modell Speech-02, mit einer Sprachsynthese Ähnlichkeit von bis zu 99%, Studio-Qualität, und Unterstützung für mehr als 30 Sprachen und eine breite Palette von Mund...
Text2Voice: eine grafische Text-zu-Sprache-Schnittstelle auf der Grundlage von Silizium-basierten Flow-APIs
Text2Voice ist ein Open-Source-Tool, das Text-zu-Sprache-Funktionen auf der Grundlage einer siliziumbasierten Mobilitäts-API bietet und sich durch eine übersichtliche grafische Benutzeroberfläche (GUI) auszeichnet. Es wurde vom Entwickler Sheldon Lee auf GitHub erstellt, um Benutzern die einfache Umwandlung von Text in Sprache über eine Schnittstelle zu ermöglichen. Das Projekt verwendet Py...
Operatives Open-Source-Projekt, das mehrere fortschrittliche Sprachsynthesedienste integriert
Open-VoiceCanvas ist eine Open-Source-Plattform für Sprachsynthese, die vom ItusiAI-Team entwickelt wurde. Sie unterstützt mehr als 50 Sprachen, wandelt Text in natürliche Sprache um und ermöglicht es Ihnen, eine personalisierte Stimme zu klonen, indem Sie Audio hochladen. Das Projekt integriert OpenAI TTS, AWS Polly und MiniM...
Mureka: ein KI-generiertes Werkzeug für Originalmusik von Kunlun
Mureka ist eine KI-Musikgenerierungsplattform des chinesischen Unternehmens Kunlun World Wide, die im August 2024 in Betrieb genommen wurde und aufgrund ihrer ausgezeichneten Klangqualität und einfachen Bedienung schnell Aufmerksamkeit in Übersee erlangte. Am 26. März 2025 brachte Mureka das weltweit erste Musikinferenz-Makromodell, Mureka O1, und ein Basismodell, Mureka V6, auf den Markt...
csm-mlx: csm-Sprachgenerierungsmodell für Apple-Geräte
csm-mlx basiert auf dem von Apple entwickelten MLX-Framework, das für das Sprachdialogmodell CSM (Conversation Speech Model) speziell für Apple Silicon optimiert wurde. Dieses Projekt ermöglicht es Benutzern, effiziente Spracherzeugung auf Apple-Geräten auf einfache Art und Weise...
Autiobooks: epub ebooks in m4b-Hörbücher umwandeln
Autiobooks ist ein Open-Source-Tool, das Benutzern helfen soll, eBooks im .epub-Format schnell in Hörbücher im .m4b-Format zu konvertieren. Es verwendet die hochwertige Sprachsynthesetechnologie von Kokoro, um ein natürliches und flüssiges Audio zu erzeugen. Das Tool wurde von David Nesbitt entwickelt und folgt dem MIT ...
PlayHT: ein KI-Tool zur Erzeugung hyperrealistischer Sprache
PlayHT ist eine effiziente Online-Plattform, die sich auf die KI-Sprachgenerierung konzentriert und den Nutzern hilft, Text schnell in natürliche, realistische Sprache umzuwandeln. Es bietet mehr als 600 KI-Stimmen, unterstützt mehr als 60 Sprachen und verschiedene Akzente und eignet sich für eine Vielzahl von Szenarien wie Podcast-Produktion, Bildungsinhalte, Marketing und Werbung. Die Benutzer müssen nur die...
Spark-TTS: Ein Text-to-Speech-Werkzeug zur Erzeugung natürlicher Sprache
Spark-TTS ist ein Open-Source-Tool für Text-to-Speech (TTS), das vom SparkAudio-Team entwickelt wurde und auf GitHub gehostet wird. Es wurde entwickelt, um Benutzern zu helfen, Text effizient in natürliche und flüssige Sprache umzuwandeln. Es basiert auf fortschrittlicher Deep-Learning-Technologie und unterstützt mehrere Sprachen und Sprachstile...
Azure TTS Importer: Integration von Sprachsynthesediensten in Lesesoftware
TTS Importer ist ein Open-Source-Projekt, das den einfachen Import von Azure TTS (Text-to-Speech) Sprachsynthesediensten in verschiedene Lesesoftware ermöglicht. Das Tool unterstützt mehrere beliebte Lesesoftware, einschließlich Read (legado), Love Reader, Source Reader und mehr. Mit TTS Importe...
Kokoro WebGPU: Ein Text-to-Speech-Dienst für den Offline-Betrieb in Browsern
Kokoro WebGPU ist eine WebGPU-Version des Kokoro Text-to-Speech (TTS)-Modells, das von der WebML Community auf der Hugging Face-Plattform bereitgestellt wird. Das Projekt nutzt die WebGPU-Technologie, um Benutzern die Möglichkeit zu geben, effiziente Text-zu-Sprache-Konvertierungen lokal in ihren Browsern auszuführen...
Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und Stimmen
Kokoro-ONNX ist ein quelloffenes Text-to-Speech (TTS)-Tool, das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle, zielt das Projekt darauf ab, eine effiziente und schnelle Sprachsyntheselösung zu bieten. Kokoro-ONNX unterstützt mehrere Sprachen, einschließlich Englisch, und ist geplant, Französisch, Japanisch, Koreanisch und Chinesisch zu unterstützen...
OpenAI Edge TTS: Freie Text-to-Speech-API mit Edge TTS, kompatibel mit OpenAI-Formaten
OpenAI Edge TTS ist ein Open-Source-Projekt, das eine native, mit OpenAI kompatible Text-to-Speech (TTS)-API bereitstellt. Das Projekt nutzt den Online-Text-to-Speech-Dienst von Microsoft Edge, um Benutzern die Erzeugung hochwertiger Sprachausgabe zu ermöglichen...
zurück zum Anfang