Derzeitige Position:Abb. Anfang " AI-Antworten

Was ist das Dolphin-Spracherkennungsmodell und was sind seine wichtigsten Entwickler und Funktionen?

2025-08-25

1.5 K

Dolphin ist ein Open-Source-Spracherkennungsmodell, das gemeinsam von DataoceanAI und der Tsinghua-Universität entwickelt wurde und sich auf die vielseitige Verarbeitung asiatischer Sprachen konzentriert. Seine Kernfunktionen umfassen:

Breite SprachabdeckungUnterstützung von 40 asiatischen Sprachen und 22 chinesischen Dialekten, die Ostasien, Südasien, Südostasien und den Nahen Osten abdecken
MultitaskingIntegrierte Funktionen für Sprache-zu-Text (ASR), Sprachaktivitätserkennung (VAD), Audiosegmentierung und Spracherkennung (LID)
Starke Datenbasis: trainiert auf über 210.000 Stunden eigener und öffentlich zugänglicher Audiodaten
Innovation in der ArchitekturEs wird eine hybride CTC-Attention-Architektur verwendet, bei der der Encoder einen E-Branchformer und der Decoder einen Transformer verwendet.
Zweischichtiges EtikettiersystemGenaue Unterscheidung von Dialektvarianten durch (z. B. )

Das Projekt wurde auf GitHub veröffentlicht und bietet zwei Modellspezifikationen, Base (140M Parameter) und Small (372M Parameter), die die Anforderungen an die Verarbeitungsgeschwindigkeit und die Erkennungsgenauigkeit berücksichtigen.

Diese Antwort stammt aus dem ArtikelDolphin: Asiatische Spracherkennung und Speech-to-Text-Modelle für asiatische SprachenDie

Was ist das Dolphin-Spracherkennungsmodell und was sind seine wichtigsten Entwickler und Funktionen?

Ähnliche Artikel

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Beliebte AI-Tools

Neue Veröffentlichungen

Neueste AI-Tools

Was ist das Dolphin-Spracherkennungsmodell und was sind seine wichtigsten Entwickler und Funktionen?

Ähnliche Artikel

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Beliebte AI-Tools

Neue Veröffentlichungen

Neueste AI-Tools

Schnellabfragestation AI-Tool