配備前に以下の環境要件を満たす必要がある:
- オペレーティングシステムWindows 10/11(64ビット)またはLinux(Debian/Ubuntu推奨)
- パイソン3.10以上
- 必須コンポーネント:: Git (コードクローニング)、eSpeak NG (テキストフォニゼーション処理)
- GPUアクセラレーションはオプションNVIDIAグラフィックスとCUDAサポートが必要です。Linuxではlibsndfile1とffmpegの追加インストールが必要です。
特記事項:WindowsユーザーはeSpeak NGインストール後、ターミナルを再起動する必要があります。 sudo apt install espeak-ng
(Linux)または.msiパッケージ(Windows)をインストールして、依存関係のインストールを完了します。
この答えは記事から得たものである。Kitten-TTS-Server: セルフデプロイ可能な軽量音声合成サービスについて