部署前需准备以下环境:
- 基础系统:Windows 10/11(64位)或Linux(Debian/Ubuntu推荐)
- Python环境:3.10及以上版本
- 必备组件:Git代码管理工具和eSpeak NG音素引擎
- GPU加速(可选):需要NVIDIA显卡并安装CUDA驱动
特别注意:
- Windows用户需安装espeak-ng-X.XX-x64.msi后重启终端
- Linux用户需执行
sudo apt install espeak-ng libsndfile1 ffmpeg安装依赖 - GPU用户需额外配置NVIDIA Container Toolkit(Docker部署时)
本答案来源于文章《Kitten-TTS-Server:一个可自行部署的轻量级文本转语音服务》

































