ドルフィンのポジショニングとコアテクノロジーの強み
DolphinはDataoceanAIと清華大学が共同開発したインテリジェント音声処理システムで、複雑なアジア言語環境における音声認識の課題を解決することを中核的な位置付けとしている。このモデルは先進的なCTC-Attentionハイブリッドアーキテクチャを採用しており、エンコーダーは革新的なE-ブランチフォーマー構造を使用し、デコーダーはアジア言語の音響的・文法的特徴に特に最適化されたトランスフォーマーフレームワークに基づいています。
技術の大きなブレークスルーは、40のアジア言語と22の中国方言に対応する処理能力、21万時間を超えるマルチソースの学習データ(独自データと公開データセットの両方)に基づくこと、言語的・地域的変種を正確に区別するための独自の2層タグ付けシステム(など)の使用に反映されています。汎用の音声認識モデルと比較して、Dolphinのアジア言語、特に中国語の方言における認識精度は著しく向上しており、小型のモデルではエラーレートを25.21 TP3Tまで低減しています。
この答えは記事から得たものである。ドルフィン:アジア言語認識とアジア言語のための音声テキストモデルについて




























