Anforderungen an den Einbau
Muyan-TTS muss in einer Linux-Umgebung laufen, empfohlen wird ein Ubuntu-System. Zu den wichtigsten Abhängigkeiten gehören Python 3.10, FFmpeg und andere Tools.
Installationsschritte
- Klonen von GitHub-Repositories:
git clone https://github.com/MYZY-AI/Muyan-TTS.git - Erstellen Sie eine virtuelle Umgebung von conda:
conda create -n muyan-tts python=3.10 -y - Installieren Sie die Projektabhängigkeiten:
make build - Herunterladen von vortrainierten Modellen (erfordert ca. 20 GB Speicherplatz)
Hardware-Voraussetzung
- Inferenz-UmgebungNVIDIA A100 (40 GB) oder gleichwertiger Grafikprozessor empfohlen
- AusbildungsumfeldMulti-Card-GPU-Cluster für das Pre-Training erforderlich (Gesamtkosten für das Training ~ 50.000 $)
- SpeicheranforderungenMindestens 16 GB GPU-Grafikspeicher für die Inferenz des Basismodells erforderlich
Optionen für den Einsatz
Unterstützt die lokale API-Bereitstellung (Standardport 8020), auf die über denpython api.pyStartdienste zur einfachen Integration in verschiedene Anwendungen.
Diese Antwort stammt aus dem ArtikelMuyan-TTS: Personalisiertes Podcast-Sprachtraining und -syntheseDie































