Llasa-3B的核心技术背景
Llasa-3B确实是由香港科技大学音频实验室(HKUST Audio)研发的开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构进行开发,经过专业团队的细致调优,在语音生成质量方面达到行业领先水平。
Main technical characteristics
- 采用Llama架构优化版,参数量达到3.2B级别
- 支持Transformers和vLLM框架
- 实现了16kHz高质量音频输出
- 开放模型权重可供二次开发
applied value
作为开源解决方案,Llasa-3B为研究机构和开发者提供了强大的语音合成工具,推动了语音技术的发展和应用创新。
This answer comes from the articleLlasa 1~8B: an open source text-to-speech model for high quality speech generation and cloningThe