什么是Llasa-3B模型？它的主要开发者是谁？

2025-09-10

2.1 K

Llasa-3B是由香港科技大学音频实验室（HKUST Audio）开发的一个开源文本转语音（TTS）模型。它基于Llama 3.2B架构，经过细致调优，旨在提供高质量的语音生成服务。该模型不仅支持将文字转换成自然流畅的声音，还具备情感表达和个性化语音克隆等先进功能。

Llasa-3B的主要特点包括：

该模型以其在自然语音合成方面的表现力和灵活性，已经成为研究人员和开发者关注的热点项目，可以通过Hugging Face平台体验和使用。

Ferramenta de IA da estação de consulta rápida