Seed-VC是由开发者Plachtaa在GitHub上发布的开源语音与歌声转换工具。它通过AI技术实现高质量的音频转换,核心特点包括:
- 少样本需求:仅需1-30秒参考音频即可模仿目标音色
- 实时转换:支持400毫秒超低延迟的实时语音处理
- 多模式支持:提供语音转换(VC)、歌声转换(SVC)和实时转换三种模式
- 开源免费:代码完全公开,适合二次开发和本地部署
该项目整合了Whisper语音识别和BigVGAN声码器等先进技术,能够保持输出声音的清晰度和自然度。适用于在线会议、直播互动、音乐制作等多种场景。
本答案来源于文章《Seed-VC:支持少样本实时转换语音和歌声》