Die folgenden Umgebungsanforderungen müssen vor der Bereitstellung erfüllt sein:
- BetriebssystemWindows 10/11 (64-bit) oder Linux (Debian/Ubuntu empfohlen)
- Python: 3.10 oder höher
- wesentlicher BestandteilGit (für das Klonen von Code), eSpeak NG (Text-Phonisierungsverarbeitung)
- GPU-Beschleunigung optional: NVIDIA-Grafik und CUDA-Unterstützung erforderlich, Linux erfordert zusätzliche Installation von libsndfile1 und ffmpeg.
Besonderer Hinweis: Windows-Benutzer müssen das Terminal nach der Installation von eSpeak NG neu starten. sudo apt install espeak-ng
(Linux) oder installieren Sie das .msi-Paket (Windows), um die Installation der Abhängigkeiten abzuschließen.
Diese Antwort stammt aus dem ArtikelKitten-TTS-Server: Ein selbstentwickelbarer, leichtgewichtiger Text-to-Speech-DienstDie