CSM Voice Cloning ist ein Open-Source-Tool zum Klonen von Stimmen, das auf dem Sesame CSM-1B-Modell des Entwicklers Isaiah Bjork basiert und auf GitHub gehostet wird. Seine Hauptfunktion besteht darin, schnell geklonte Stimmen mit ähnlichen Merkmalen aus vom Benutzer bereitgestellten Audio-Samples zu erzeugen, und richtet sich vor allem an Autoren von Inhalten, Entwickler und andere Gruppen.
Liste der Kernfunktionen:
- SprachklonenGenerieren Sie ähnliche Sounds, indem Sie Samples im MP3/WAV-Format hochladen (empfohlen 2-3 Minuten)
- Text-to-SpeechAusgabe von Audiodateien mit geklontem Ton durch Eingabe von Text
- Dual-Mode-BetriebUnterstützt lokale GPU-Verarbeitung oder modale Cloud-GPU-Beschleunigung
- Open Source Anpassbar: Ermöglicht den Nutzern die Anpassung der Modellparameter (z. B. max_seq_len), um lange Audiodaten zu berücksichtigen.
- Unterstützung mehrerer FormateKompatibel mit gängigen Ein- und Ausgängen für Audioformate
Obwohl der Klon-Effekt die Originalstimme nicht 100% wiederherstellen kann, kann er wichtige stimmliche Merkmale beibehalten und eignet sich für die schnelle Erstellung von Voiceover-Material.
Diese Antwort stammt aus dem ArtikelCSM Voice Cloning: Schnelles Voice Cloning mit CSM-1BDie































