Overseas access: www.kdjingpai.com
Bookmark Us
Current Position:fig. beginning " AI Answers

什么是Muyan-TTS?它的核心功能有哪些?

2025-08-23 1.5 K

Muyan-TTS简介

Muyan-TTS是一款专为播客场景设计的开源文本转语音模型,基于Llama-3.2-3B架构构建,结合SoVITS解码器技术。该模型通过超过10万小时播客音频数据的预训练,能够生成高质量的自然语音输出。

core functionality

  • Zero-sample speech synthesis:无需额外训练即可生成播客风格语音,支持多种音色模仿
  • Personalized voice customization:通过少量(几十分钟)单人语音数据微调可生成特定speaker的语音
  • Efficient Reasoning:在NVIDIA A100 GPU上每秒可生成约0.33秒音频,优于多数开源TTS模型
  • 完整的开发生态:提供训练代码、数据处理管道和API部署工具

项目采用Apache 2.0许可证,模型权重和代码已在GitHub、Hugging Face和ModelScope平台开放。

Recommended

Can't find AI tools? Try here!

Just type in the keyword Accessibility Bing SearchYou can quickly find all the AI tools on this site.

Top

en_USEnglish