Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Was ist das Dolphin-Spracherkennungsmodell und was sind seine wichtigsten Entwickler und Funktionen?

2025-08-25 1.5 K

Dolphin ist ein Open-Source-Spracherkennungsmodell, das gemeinsam von DataoceanAI und der Tsinghua-Universität entwickelt wurde und sich auf die vielseitige Verarbeitung asiatischer Sprachen konzentriert. Seine Kernfunktionen umfassen:

  • Breite SprachabdeckungUnterstützung von 40 asiatischen Sprachen und 22 chinesischen Dialekten, die Ostasien, Südasien, Südostasien und den Nahen Osten abdecken
  • MultitaskingIntegrierte Funktionen für Sprache-zu-Text (ASR), Sprachaktivitätserkennung (VAD), Audiosegmentierung und Spracherkennung (LID)
  • Starke Datenbasis: trainiert auf über 210.000 Stunden eigener und öffentlich zugänglicher Audiodaten
  • Innovation in der ArchitekturEs wird eine hybride CTC-Attention-Architektur verwendet, bei der der Encoder einen E-Branchformer und der Decoder einen Transformer verwendet.
  • Zweischichtiges EtikettiersystemGenaue Unterscheidung von Dialektvarianten durch (z. B. )

Das Projekt wurde auf GitHub veröffentlicht und bietet zwei Modellspezifikationen, Base (140M Parameter) und Small (372M Parameter), die die Anforderungen an die Verarbeitungsgeschwindigkeit und die Erkennungsgenauigkeit berücksichtigen.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang