海外访问：www.kdjingpai.com

Ctrl + D 收藏本站

当前位置：首页 » AI答疑

什么是Dolphin语音识别模型，它的主要开发者和特点是什么？

2025-08-25

1.5 K

Dolphin是由DataoceanAI与清华大学联合开发的开源语音识别模型，专注于亚洲语言的多功能处理。其核心特点包括：

语言覆盖广：支持40种亚洲语言及22种中国方言，涵盖东亚、南亚、东南亚和中东地区
多任务处理：集成了语音转文本（ASR）、语音活动检测（VAD）、音频分割和语言识别（LID）功能
数据基础强：基于超过21万小时的专有和公开音频数据训练
架构创新：采用CTC-Attention混合架构，编码器使用E-Branchformer，解码器采用Transformer
双层标记系统：通过<语言代码><地区代码>（如<zh><CN>）精确区分方言变体

该项目已在GitHub开源，提供base（140M参数）和small（372M参数）两种模型规格，兼顾处理速度与识别精度需求。

本答案来源于文章《Dolphin：面向亚洲语言识别与语音转文本模型》

相关文章

未经允许不得转载：AI生产力工具 » 什么是Dolphin语音识别模型，它的主要开发者和特点是什么？

相关推荐