AI-Audio

 Website einreichen

Kitten-TTS-Server: Ein selbstentwickelbarer, leichtgewichtiger Text-to-Speech-Dienst
Kitten-TTS-Server ist ein Open-Source-Projekt, das einen funktionserweiterten Server für das leichtgewichtige KittenTTS-Modell bereitstellt. Benutzer können dieses Projekt nutzen, um ihren eigenen Text-to-Speech (TTS) Dienst zu erstellen. Der Hauptvorteil dieses Projekts ist, dass es auf dem ursprünglichen Modell basiert und eine intuitive Webseite hinzufügt ...
4.7 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
FineShare: ein Authoring-Tool zur Erzeugung von KI-Stimme und -Musik
FineShare ist eine Plattform, die sich auf KI-Audio- und -Videotechnologie konzentriert und eine Vielzahl von Tools anbietet, mit denen Nutzer hochwertige Sprach-, Musik- und Videoinhalte erstellen können. Zu den Kernprodukten der Website gehören FineVoice, Singify und FineCam für die Spracherzeugung und -konvertierung, die KI-Musikproduktion und die virtuelle Kamera...
2.8 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
CyberSmart: Umwandlung von Text in Sprache und Digital Human Video
Xunfei Zhizuo ist eine von Xunfei entwickelte Plattform, die Dienste zur Erstellung von Inhalten mit künstlicher Intelligenz anbietet. Ihre Kernfunktion besteht darin, vom Benutzer eingegebenen Text in Sprache umzuwandeln, ein Prozess, der oft als “KI-Synchronisation” oder “Sprachsynthese” bezeichnet wird. Die Benutzer können aus einer Vielzahl vorprogrammierter virtueller Stimmen (d. h. “Moderatoren”) mit verschiedenen Stilen wählen, wie z. B. Nachrichtensendungen...
2.9 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Parrot TTS: ein Lesetool, das Webtexte in natürliche Sprache umwandelt
Parrot TTS ist eine Chrome-Erweiterung, die Webtext in natürliche Sprache umwandelt. Es verwendet fortschrittliche KI-Technologie, um eine fast menschliche Stimme zu bieten, die das Problem der traditionellen Text-to-Speech-Tools löst, die mechanisch klingen. Benutzer können Artikel, Nachrichten oder Forschungsmaterialien mit einem Klick in Audio konvertieren, geeignet für Multitasking...
2.4 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Wavel AI: Ein Tool für die schnelle Erstellung mehrsprachiger Videosynchronisation und Untertitelung
Wavel AI ist eine KI-basierte Plattform, die den Nutzern bei der schnellen Erstellung und Lokalisierung von Videoinhalten hilft. Sie erleichtert den Nutzern die Erstellung mehrsprachiger Video- und Audioinhalte durch Funktionen wie das Klonen von Stimmen, Text-to-Speech und die automatische Erstellung von Untertiteln. Die Plattform unterstützt über 70 Sprachen und bietet mehr als 1.000 realistische Stimmen für Inhaltsersteller...
2.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
AIVocal: ein kostenloses KI-Tool zur Erstellung von Podcasts und zur Audiobearbeitung
AIVocal ist eine kostenlose KI-Audioverarbeitungsplattform, die Text-to-Speech (TTS), Speech-to-Text (STT), menschliche Sprachseparation und Podcast-Erzeugung bietet. Benutzer können es ohne Registrierung verwenden, und es unterstützt 24 Sprachen und mehr als 900 natürliche Töne, die für die Produktion von Podcasts, Hörbüchern, Video-Synchronisation und so weiter geeignet ist. Die Oberfläche der Plattform ist intuitiv und...
3.3 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Dia: ein Text-to-Speech-Modell zur Erzeugung hyperrealistischer Multiplayer-Dialoge
Dia ist ein von Nari Labs entwickeltes Open-Source-Text-to-Speech (TTS)-Modell, das sich auf die Erzeugung von hyperrealistischem Dialog-Audio konzentriert. Es wandelt Textskripte in einem einzigen Prozess in realistische Dialoge mit mehreren Zeichen um, unterstützt die Steuerung von Emotionen und Intonation und generiert sogar nonverbale Ausdrücke wie Lachen...
3.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
MiniMax Audio (Conch Speech): KI-Tool zur Erzeugung natürlicher Sprache
MiniMax Audio ist ein KI-Spracherzeugungstool von MiniMax, dessen Hauptfunktion die schnelle Umwandlung von Text in sehr ähnliche natürliche Sprache ist. Es basiert auf dem Modell Speech-02, mit einer Sprachsynthese Ähnlichkeit von bis zu 99%, Studio-Qualität, und Unterstützung für mehr als 30 Sprachen und eine breite Palette von Mund...
8.7 Kdurch (wie in "durchgehender Zug")1Gelobt
0Lesezeichen
Text2Voice: eine grafische Text-zu-Sprache-Schnittstelle auf der Grundlage von Silizium-basierten Flow-APIs
Text2Voice ist ein Open-Source-Tool, das Text-zu-Sprache-Funktionen auf der Grundlage einer siliziumbasierten Mobilitäts-API bietet und sich durch eine übersichtliche grafische Benutzeroberfläche (GUI) auszeichnet. Es wurde vom Entwickler Sheldon Lee auf GitHub erstellt, um Benutzern die einfache Umwandlung von Text in Sprache über eine Schnittstelle zu ermöglichen. Das Projekt verwendet Py...
3.6 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Operatives Open-Source-Projekt, das mehrere fortschrittliche Sprachsynthesedienste integriert
Open-VoiceCanvas ist eine Open-Source-Plattform für Sprachsynthese, die vom ItusiAI-Team entwickelt wurde. Sie unterstützt mehr als 50 Sprachen, wandelt Text in natürliche Sprache um und ermöglicht es Ihnen, eine personalisierte Stimme zu klonen, indem Sie Audio hochladen. Das Projekt integriert OpenAI TTS, AWS Polly und MiniM...
3.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Mureka: ein KI-generiertes Werkzeug für Originalmusik von Kunlun
Mureka ist eine KI-Musikgenerierungsplattform des chinesischen Unternehmens Kunlun World Wide, die im August 2024 in Betrieb genommen wurde und aufgrund ihrer ausgezeichneten Klangqualität und einfachen Bedienung schnell Aufmerksamkeit in Übersee erlangte. Am 26. März 2025 brachte Mureka das weltweit erste Musikinferenz-Makromodell, Mureka O1, und ein Basismodell, Mureka V6, auf den Markt...
5.9 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
csm-mlx: csm-Sprachgenerierungsmodell für Apple-Geräte
csm-mlx basiert auf dem von Apple entwickelten MLX-Framework, das für das Sprachdialogmodell CSM (Conversation Speech Model) speziell für Apple Silicon optimiert wurde. Dieses Projekt ermöglicht es Benutzern, effiziente Spracherzeugung auf Apple-Geräten auf einfache Art und Weise...
3.3 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Autiobooks: epub ebooks in m4b-Hörbücher umwandeln
Autiobooks ist ein Open-Source-Tool, das Benutzern helfen soll, eBooks im .epub-Format schnell in Hörbücher im .m4b-Format zu konvertieren. Es verwendet die hochwertige Sprachsynthesetechnologie von Kokoro, um ein natürliches und flüssiges Audio zu erzeugen. Das Tool wurde von David Nesbitt entwickelt und folgt dem MIT ...
3.2 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
PlayHT: ein KI-Tool zur Erzeugung hyperrealistischer Sprache
PlayHT ist eine effiziente Online-Plattform, die sich auf die Erzeugung von KI-Sprache konzentriert und Nutzern hilft, Text schnell in natürliche, realistische Sprache umzuwandeln. Es bietet mehr als 600 KI-Stimmen, unterstützt mehr als 60 Sprachen und verschiedene Akzente und ist für eine Vielzahl von Szenarien wie Podcast-Produktion, Bildungsinhalte, Marketing und Werbung geeignet. Benutzer müssen nur Text eingeben, den passenden Sprachstil auswählen,...
4.0 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Spark-TTS: Ein Text-to-Speech-Werkzeug zur Erzeugung natürlicher Sprache
Spark-TTS ist ein Open-Source-Tool für Text-to-Speech (TTS), das vom SparkAudio-Team entwickelt wurde und auf GitHub gehostet wird. Es wurde entwickelt, um Benutzern zu helfen, Text effizient in natürliche und flüssige Sprache umzuwandeln. Es basiert auf fortschrittlicher Deep-Learning-Technologie und unterstützt mehrere Sprachen und Sprachstile...
4.3 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Azure TTS Importer: Integration von Sprachsynthesediensten in Lesesoftware
TTS Importer ist ein Open-Source-Projekt, das den einfachen Import von Azure TTS (Text-to-Speech) Sprachsynthesediensten in verschiedene Lesesoftware ermöglicht. Das Tool unterstützt mehrere beliebte Lesesoftware, einschließlich Read (legado), Love Reader, Source Reader und mehr. Mit TTS Importe...
3.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Kokoro WebGPU: Ein Text-to-Speech-Dienst für den Offline-Betrieb in Browsern
Kokoro WebGPU ist eine WebGPU-Version des Kokoro Text-to-Speech (TTS)-Modells, das von der WebML Community auf der Hugging Face-Plattform bereitgestellt wird. Das Projekt nutzt die WebGPU-Technologie, um Benutzern die Möglichkeit zu geben, effiziente Text-zu-Sprache-Konvertierungen lokal in ihren Browsern auszuführen...
4.3 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Kokoro-ONNX: Effizientes Text-to-Speech-Tool mit Unterstützung für mehrere Sprachen und Stimmen
Kokoro-ONNX ist ein quelloffenes Text-to-Speech (TTS)-Tool, das auf der ONNX-Laufzeitumgebung basiert. Entwickelt von thewh1teagle, zielt das Projekt darauf ab, eine effiziente und schnelle Sprachsyntheselösung zu bieten. Kokoro-ONNX unterstützt mehrere Sprachen, einschließlich Englisch, und ist geplant, Französisch, Japanisch, Koreanisch und Chinesisch zu unterstützen...
5.7 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
OpenAI Edge TTS: Freie Text-to-Speech-API mit Edge TTS, kompatibel mit OpenAI-Formaten
OpenAI Edge TTS ist ein Open-Source-Projekt, das eine native, mit OpenAI kompatible Text-to-Speech (TTS)-API bereitstellt. Das Projekt nutzt den Online-Text-to-Speech-Dienst von Microsoft Edge, um Benutzern die Erzeugung hochwertiger Sprachausgabe zu ermöglichen...
5.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen

AI-Audio

Schnellabfragestation AI-Tool