KittenTTS 是由 KittenML 团队开发的开源文本转语音(TTS)模型,设计专注于轻量化和高效性。其显著特点是模型体积小于 25MB,仅包含约 1500 万个参数,可在低端设备上仅通过 CPU 运行而无需 GPU 支持。这使得 KittenTTS 特别适合嵌入式设备、边缘计算和离线场景的应用。与市场上其他主流 TTS 模型相比,KittenTTS 在保持极小体积的同时,能够提供高质量的语音生成性能。
Diese Antwort stammt aus dem ArtikelKittenTTS: Ein leichtgewichtiges Text-to-Speech-ModellDie