Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

什么是Dolphin语音识别模型,它的主要开发者和特点是什么?

2025-08-25 1.3 K

Dolphin是由DataoceanAI与清华大学联合开发的开源语音识别模型,专注于亚洲语言的多功能处理。其核心特点包括:

  • 语言覆盖广:支持40种亚洲语言及22种中国方言,涵盖东亚、南亚、东南亚和中东地区
  • Multitasking:集成了语音转文本(ASR)、语音活动检测(VAD)、音频分割和语言识别(LID)功能
  • 数据基础强:基于超过21万小时的专有和公开音频数据训练
  • 架构创新:采用CTC-Attention混合架构,编码器使用E-Branchformer,解码器采用Transformer
  • 双层标记系统:通过<语言代码><地区代码>(如<zh><CN>)精确区分方言变体

该项目已在GitHub开源,提供base(140M参数)和small(372M参数)两种模型规格,兼顾处理速度与识别精度需求。

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch