O KittenTTS é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pela equipe do KittenML e projetado com foco em leveza e eficiência. Seu diferencial é que o modelo tem menos de 25 MB de tamanho, contém apenas cerca de 15 milhões de parâmetros e pode ser executado em dispositivos de baixo custo somente com a CPU, sem suporte de GPU. Isso torna o KittenTTS particularmente adequado para dispositivos incorporados, computação de ponta e cenários off-line. O KittenTTS oferece desempenho de geração de fala de alta qualidade e, ao mesmo tempo, mantém um tamanho extremamente pequeno em comparação com outros modelos TTS líderes do mercado.
Essa resposta foi extraída do artigoKittenTTS: um modelo leve de conversão de texto em falaO