当前位置：首页 » AI答疑

Dia是当前最先进的开源多角色对话生成TTS模型

2025-08-24

1.4 K

Dia的开源多角色对话生成技术

Dia作为由Nari Labs开发的开源文本转语音模型，采用16亿参数架构，是目前最先进的多角色对话生成解决方案。其核心优势在于突破传统TTS模型的单角色限制，通过创新的语音标记系统（如[S1][S2]）实现多说话者的自然对话生成。

技术实现上，Dia融合了SoundStorm和Parakeet等先驱技术的优点，并进行了多项创新：

模型托管在Hugging Face平台并得到Google TPU Research Cloud支持，确保了技术的前沿性和可靠性。其开源性更进一步推动了语音合成领域的发展。