海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

Llasa-3B是香港科技大学音频实验室开发的高品质开源文本转语音模型

2025-09-10 2.0 K

Llasa-3B的核心技术背景

Llasa-3B确实是由香港科技大学音频实验室(HKUST Audio)研发的开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构进行开发,经过专业团队的细致调优,在语音生成质量方面达到行业领先水平。

主要技术特性

  • 采用Llama架构优化版,参数量达到3.2B级别
  • 支持Transformers和vLLM框架
  • 实现了16kHz高质量音频输出
  • 开放模型权重可供二次开发

应用价值

作为开源解决方案,Llasa-3B为研究机构和开发者提供了强大的语音合成工具,推动了语音技术的发展和应用创新。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文