Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

VibeVoice-1.5B是目前支持长音频多角色对话的最先进开源TTS模型

2025-08-27 30

VibeVoice-1.5B的技术突破与定位

微软研究院发布的VibeVoice-1.5B在开源文本转语音(TTS)领域实现了三大技术突破:1.5B参数规模的模型架构使其成为目前能力最强的开源对话型TTS模型;独家的7.5Hz超低帧率连续语音分词器技术可在保持音质的同时处理长达90分钟的音频序列;基于LLM+扩散模型的融合框架首次实现单次推理支持4角色对话。这三项创新使其在长音频合成、多说话人交互等场景的性能指标上显著超越传统TTS系统。

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch