Overseas access: www.kdjingpai.com

Bookmark Us

Current Position:fig. beginning " AI Answers

Llasa-3B是香港科技大学音频实验室开发的高品质开源文本转语音模型

2025-09-10

2.1 K

Llasa-3B的核心技术背景

Llasa-3B确实是由香港科技大学音频实验室（HKUST Audio）研发的开源文本转语音（TTS）模型。该模型基于Llama 3.2B架构进行开发，经过专业团队的细致调优，在语音生成质量方面达到行业领先水平。

Main technical characteristics

采用Llama架构优化版，参数量达到3.2B级别
支持Transformers和vLLM框架
实现了16kHz高质量音频输出
开放模型权重可供二次开发

applied value

作为开源解决方案，Llasa-3B为研究机构和开发者提供了强大的语音合成工具，推动了语音技术的发展和应用创新。

This answer comes from the articleLlasa 1~8B: an open source text-to-speech model for high quality speech generation and cloningThe

Related articles

May not be reproduced without permission:AI productivity tools " Llasa-3B是香港科技大学音频实验室开发的高品质开源文本转语音模型

Recommended

English