海外访问：www.kdjingpai.com

Ctrl + D 收藏本站

当前位置：首页 » AI答疑

什么是CSM Voice Cloning？它的核心功能有哪些？

2025-08-29

1.4 K

CSM Voice Cloning 是由开发者 Isaiah Bjork 基于 Sesame CSM-1B 模型开发的开源语音克隆工具，托管于 GitHub。其核心功能是通过用户提供的音频样本快速生成具有相似特征的克隆语音，主要面向内容创作者、开发者等群体。

核心功能清单：

语音克隆：通过上传MP3/WAV格式的样本（推荐2-3分钟）生成相似声音
文本转语音：输入文字即可输出带有克隆声音的音频文件
双模运行：支持本地GPU处理或Modal云端GPU加速
开源可定制：允许用户调整模型参数（如max_seq_len）适配长音频
多格式支持：兼容常见音频格式输入输出

虽然克隆效果不能100%还原原声，但能保留显著的声音特征，适合快速生成配音素材。

本答案来源于文章《CSM Voice Cloning：利用CSM-1B快速克隆声音》

相关文章

未经允许不得转载：AI生产力工具 » 什么是CSM Voice Cloning？它的核心功能有哪些？

相关推荐