海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

現在の場所図頭 " AIアンサー

什么是Dolphin语音识别模型，它的主要开发者和特点是什么？

2025-08-25

1.3 K

Dolphin是由DataoceanAI与清华大学联合开发的开源语音识别模型，专注于亚洲语言的多功能处理。其核心特点包括：

语言覆盖广：支持40种亚洲语言及22种中国方言，涵盖东亚、南亚、东南亚和中东地区
マルチタスク：集成了语音转文本（ASR）、语音活动检测（VAD）、音频分割和语言识别（LID）功能
数据基础强：基于超过21万小时的专有和公开音频数据训练
架构创新：采用CTC-Attention混合架构，编码器使用E-Branchformer，解码器采用Transformer
双层标记系统：通过<语言代码><地区代码>（如<zh><CN>）精确区分方言变体

该项目已在GitHub开源，提供base（140M参数）和small（372M参数）两种模型规格，兼顾处理速度与识别精度需求。

この答えは記事から得たものである。ドルフィン：アジア言語認識とアジア言語のための音声テキストモデルについて

関連記事

無断転載を禁じます：AI生産性ツール " 什么是Dolphin语音识别模型，它的主要开发者和特点是什么？

おすすめ

日本語