Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Technologie zur Erzeugung synthetischer Daten löst den Korpus-Engpass bei der Sprachübersetzung

2025-09-10 2.0 K
Link direktMobile Ansicht
qrcode

Hibikis innovatives Verfahren zur Generierung synthetischer Daten löst sich von der Abhängigkeit von parallelen Korpora in herkömmlichen Sprachübersetzungssystemen. Das System nutzt die kontextuellen Alignment-Fähigkeiten des maschinellen Übersetzungssystems MADLAD, um auf Wortebene schwach überwachte Matching-Regeln aufzustellen: Wörter der Zielsprache werden nur dann beibehalten, wenn sie von der Ausgangssprache vorhergesagt werden können. Diese strenge Alignment-Strategie wird durch zwei Schlüsseltechniken erreicht:

  • Die Technik der stummen Einfügung behält die rhythmische Struktur der Äußerung bei.
  • Das TTS-System der Sprachsteuerung gewährleistet die Natürlichkeit der synthetisierten Sprache

Mit diesem Schema kann das System in Französisch-Englisch-Übersetzungsszenarien mit nur einem Sprecher als Aligner trainiert werden, was den Datenbedarf auf weniger als 10% herkömmlicher Methoden reduziert. Praktische Tests zeigen, dass das auf synthetischen Daten trainierte Modell eine Punktzahl von 4,2 auf der MOS-Metrik (Mean Opinion Score) erreicht, was dem Niveau professioneller menschlicher Übersetzer nahekommt.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang