Die folgende Umgebung muss vor dem Einsatz vorbereitet werden:
- GrundsystemWindows 10/11 (64-bit) oder Linux (Debian/Ubuntu empfohlen)
- Python-UmgebungVersion 3.10 und höher
- Erforderliche KomponentenGit-Code-Verwaltungstool und eSpeak NG Phonem-Engine
- GPU-Beschleunigung (optional)NVIDIA-Grafikkarte und installierter CUDA-Treiber erforderlich
Besondere Aufmerksamkeit:
- Windows-Benutzer müssen espeak-ng-X.XX-x64.msi installieren, nachdem dieStarten Sie das Terminal neu
- Linux-Benutzer müssen den Befehl
sudo apt install espeak-ng libsndfile1 ffmpeg
Installation von Abhängigkeiten - GPU-Benutzer müssen zusätzlich das NVIDIA Container Toolkit konfigurieren (für den Einsatz von Docker)
Diese Antwort stammt aus dem ArtikelKitten-TTS-Server: Ein selbstentwickelbarer, leichtgewichtiger Text-to-Speech-DienstDie