Dolphins Positionierung und technologische Kernkompetenzen
Dolphin ist ein intelligentes Sprachverarbeitungssystem, das gemeinsam von DataoceanAI und der Tsinghua-Universität entwickelt wurde und dessen Kernaufgabe es ist, die Herausforderungen der Spracherkennung in komplexen asiatischen Sprachumgebungen zu lösen. Das Modell verwendet eine fortschrittliche CTC-Attention-Hybridarchitektur, wobei der Encoder die innovative E-Branchformer-Struktur verwendet und der Decoder auf dem Transformer-Framework basiert, das speziell für die akustischen und grammatikalischen Merkmale asiatischer Sprachen optimiert ist.
Die wichtigsten technologischen Durchbrüche spiegeln sich in der Verarbeitungsleistung wider, die 40 asiatische Sprachen und 22 chinesische Dialekte unterstützt; basierend auf mehr als 210.000 Stunden an Trainingsdaten aus verschiedenen Quellen (sowohl eigene als auch öffentliche Datensätze); und der Verwendung eines einzigartigen zweischichtigen Tagging-Systems (z. B. ) zur genauen Unterscheidung zwischen sprachlichen und regionalen Varianten. Im Vergleich zu allgemeinen Spracherkennungsmodellen ist die Erkennungsgenauigkeit von Dolphin in asiatischen Sprachen, insbesondere chinesischen Dialekten, deutlich verbessert, wobei das kleine Modell die Fehlerrate auf 25,21 TP3T reduziert.
Diese Antwort stammt aus dem ArtikelDolphin: Asiatische Spracherkennung und Speech-to-Text-Modelle für asiatische SprachenDie




























