Die lokale Installation von CSM Voice Cloning erfordert die Einhaltung bestimmter Hardware- und Software-Umgebungen, die im Folgenden beschrieben werden:
Vorgeschaltete Anforderungen:
- SoftwareNVIDIA CUDA-kompatible Grafikkarte (ausreichend Videospeicher erforderlich)
- HardwarePython Version 3.10+.
- VernetzungenStabiler Download von Modellen und Abhängigkeiten
Installationsprozess:
- Klonen Sie das Code-Repository:
git clone https://github.com/isaiahbjork/csm-voice-cloning.git
cd csm-voice-cloning - Installieren Sie abhängige Bibliotheken:
pip install -r requirements.txt
(Enthält Kernkomponenten wie PyTorch, Hugging Face Transformers usw.) - Konfigurieren Sie die Umarmungsgesichtsmünzen:
- Beantragen Sie ein API-Token auf der Hugging Face-Website
- passieren (eine Rechnung oder Inspektion etc.)
export HF_TOKEN="你的令牌"Setzen von Umgebungsvariablen
Nach der Fertigstellung können Sie den Audiopfad, den Text und andere Parameter in voice_clone.py für die Stimmerzeugung ändern. Wenn Sie das Programm zum ersten Mal ausführen, müssen Sie etwa 4 GB an Modelldateien herunterladen.
Diese Antwort stammt aus dem ArtikelCSM Voice Cloning: Schnelles Voice Cloning mit CSM-1BDie































