Posição atual:fig. início " Respostas da IA

O que é o CSM Voice Cloning e quais são seus principais recursos?

2025-08-29

1.5 K

O CSM Voice Cloning é uma ferramenta de clonagem de voz de código aberto baseada no modelo Sesame CSM-1B do desenvolvedor Isaiah Bjork, hospedada no GitHub, cuja função principal é gerar rapidamente vozes clonadas com características semelhantes a partir de amostras de áudio fornecidas pelo usuário, e destina-se principalmente a criadores de conteúdo, desenvolvedores e outros grupos.

Lista de funções essenciais:

clonagem de falaGeração de sons semelhantes com o upload de amostras no formato MP3/WAV (recomendado de 2 a 3 minutos)
conversão de texto em falaSaída de arquivos de áudio com som clonado por meio da inserção de texto
operação em modo duploSuporte para processamento de GPU local ou aceleração de GPU na nuvem Modal
Código aberto personalizávelPermite que os usuários ajustem os parâmetros do modelo (por exemplo, max_seq_len) para acomodar áudio longo.
Suporte a vários formatosCompatível com entradas e saídas de formatos de áudio comuns

Embora o efeito de clonagem não possa 100% restaurar a voz original, ele pode reter características vocais significativas e é adequado para gerar rapidamente material de locução.

Essa resposta foi extraída do artigoClonagem de voz CSM: clonagem rápida de voz com o CSM-1BO

O que é o CSM Voice Cloning e quais são seus principais recursos?

Lista de funções essenciais:

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

O que é o CSM Voice Cloning e quais são seus principais recursos?

Lista de funções essenciais:

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida