Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Durch Verstärkungslernen optimierte Version von Seed-X-7B übertrifft das Basisinstruktionsmodell in der Übersetzungsleistung

2025-08-20 269

Leistungsdurchbrüche durch PPO-Optimierung

Das Seed-X-Team hat das Basisinstruktionsmodell mit dem Proximal Policy Optimisation (PPO)-Algorithmus im Reinforcement Learning tiefgreifend optimiert, was zu einer Version von Seed-X-PPO-7B geführt hat, die Seed-X-Instruct-7B in einer Reihe von Metriken deutlich übertrifft: Die Testdaten zeigen, dass die PPO-Version auf dem WMT2023-Testsatz den BLEU-Wert der Chinesisch-Englisch-Übersetzung um 15,21 TP3T und die Terminologiegenauigkeit um 22,71 TP3T verbessert, was insbesondere bei ressourcenarmen Sprachen (z. B. Kisuaheli) von Vorteil ist.

Diese Verbesserung ergibt sich aus der kontinuierlichen Optimierung der Übersetzungsstrategien durch den PPO-Algorithmus: Das Modell erhält sofortige Rückmeldungen in mehreren Dimensionen, darunter Sprachfluss, Treue, Terminologiegenauigkeit usw., und lernt die optimalen Übersetzungsstrategien durch mehrere Iterationsrunden. Bei der Übersetzung von E-Commerce-Produktbeschreibungen ist die PPO-Version beispielsweise in der Lage, die genaue Umrechnung von Spezifikationen (z. B. "5W-40" Motorölnummer) besser beizubehalten und gleichzeitig angemessen mit kulturspezifischen Ausdrücken umzugehen (z. B. "Mindesthaltbarkeitsdatum" entspricht dem landesüblichen Ausdruck). (z. B. "Mindesthaltbarkeitsdatum" entspricht den landesüblichen Ausdrücken).

Das Team empfiehlt, in Produktionsumgebungen der PPO-Version den Vorzug zu geben, auf deren Modellgewichte und Inferenzcode direkt über den Hugging Face Hub zugegriffen werden kann, und sie so einzusetzen, dass sie mit der Basisversion vollständig kompatibel ist.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Neue Veröffentlichungen

zurück zum Anfang

de_DEDeutsch