O CSM Voice Cloning é uma ferramenta de clonagem de voz de código aberto baseada no modelo Sesame CSM-1B do desenvolvedor Isaiah Bjork, hospedada no GitHub, cuja função principal é gerar rapidamente vozes clonadas com características semelhantes a partir de amostras de áudio fornecidas pelo usuário, e destina-se principalmente a criadores de conteúdo, desenvolvedores e outros grupos.
Lista de funções essenciais:
- clonagem de falaGeração de sons semelhantes com o upload de amostras no formato MP3/WAV (recomendado de 2 a 3 minutos)
- conversão de texto em falaSaída de arquivos de áudio com som clonado por meio da inserção de texto
- operação em modo duploSuporte para processamento de GPU local ou aceleração de GPU na nuvem Modal
- Código aberto personalizávelPermite que os usuários ajustem os parâmetros do modelo (por exemplo, max_seq_len) para acomodar áudio longo.
- Suporte a vários formatosCompatível com entradas e saídas de formatos de áudio comuns
Embora o efeito de clonagem não possa 100% restaurar a voz original, ele pode reter características vocais significativas e é adequado para gerar rapidamente material de locução.
Essa resposta foi extraída do artigoClonagem de voz CSM: clonagem rápida de voz com o CSM-1BO































