配備前に以下の環境を準備する必要がある:
- 基本システムWindows 10/11(64ビット)またはLinux(Debian/Ubuntu推奨)
- Python環境バージョン3.10以上
- 必要なコンポーネント: Gitコード管理ツールとeSpeak NG音素エンジン
- GPUアクセラレーション(オプション)NVIDIA グラフィックカードと CUDA ドライバが必要です。
特に注目:
- Windowsユーザーは、espeak-ng-X.XX-x64.msiをインストールする必要があります。端末を再起動する
- Linuxユーザーは
sudo apt install espeak-ng libsndfile1 ffmpeg
依存関係のインストール - GPUユーザは、NVIDIA Container Toolkit(Dockerデプロイ用)を追加設定する必要があります。
この答えは記事から得たものである。Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービスについて