AliCloud hat vor kurzem sein neuestes maschinelles Übersetzungsmodell, Qwen-MT, veröffentlicht, das auf seinem Qwen3 Qwen-MT basiert auf einer Reihe von großen Sprachmodellentwicklungen und steht Entwicklern und Unternehmensanwendern über eine API (qwen-mt-turbo) offen. Im Gegensatz zur Verfolgung der Skalierung von Modellparametern verfolgt Qwen-MT eine leichtgewichtige MoE-Architektur (Mixture of Experts), die dem Markt eine Lösung bieten soll, die ein Gleichgewicht zwischen Übersetzungsqualität, Reaktionsfähigkeit und Aufrufkosten herstellt.
Kernpunkte: Leistung, Kosten und Kontrollierbarkeit
Die Hauptmerkmale von Qwen-MT liegen in drei Hauptbereichen:
- Umfassende SprachunterstützungDas Modell unterstützt die Übersetzung aus und in 92 Sprachen und wichtige Dialekte, die indoeuropäische, sino-tibetische, asiatisch-afrikanische, südinsulanische und andere Sprachfamilien abdecken, und ist nach eigenen Angaben in der Lage, mehr als 95% der Weltbevölkerung zu bedienen.
- Geringe Latenzzeit und niedrige KostenDank der MoE-Architektur muss das Modell bei der Bearbeitung von Übersetzungsaufgaben nicht alle Parameter aufrufen, was eine schnellere Inferenz ermöglicht. Der offizielle API-Preis gilt für eine Million Ausgaben Token Mit einem Preis von nur 2 RMB bietet diese Preisstrategie einen erheblichen Kostenvorteil in Szenarien, in denen große, hochgradig gleichzeitige Übersetzungsanfragen bearbeitet werden müssen.
- Kontrollierbarkeit in professionellen SzenarienQwen-MT bietet neben den grundlegenden Übersetzungsfunktionen auch erweiterte Funktionen wie Terminologieeingriffe, fachliche Hinweise und Übersetzungsspeicher. Benutzer können Aufforderungen anpassen, um das Modell zu leiten, genauere und konforme Übersetzungen in bestimmten Branchen (z. B. Recht, Finanzen, Medizin) oder komplexen Kontexten zu erstellen.
Leistungsbewertung: Benchmarking mit gängigen Modellen
Nach den von Aliyun veröffentlichten automatischen und manuellen Bewertungsdaten ist die Übersetzungsleistung von Qwen-MT bemerkenswert.
In der automatischen Evaluierungssitzung zeigen die Testergebnisse, die Chinesisch-Englisch, Englisch-Deutsch-Multidomain-Übersetzung und WMT24-Mehrsprachen-Übersetzungsaufgaben abdecken, dass Qwen-MT GPT-4.1-mini, Gemini-2.5-Flash und andere groß angelegte Modelle übertrifft. Die Übersetzungsergebnisse von Qwen-MT sind vergleichbar mit denen der Top-Großmodelle GPT-4.1 und Gemini-2.5-Pro.
In Anbetracht der Grenzen der automatischen Bewertung organisierte das Unternehmen auch eine manuelle Bewertung auf der Grundlage realer Anwendungsszenarien für zehn wichtige Sprachen, darunter Chinesisch, Englisch, Japanisch und Koreanisch. Die Bewertungsergebnisse zeigten, dass Qwen-MT bei der unabhängigen Bewertung durch professionelle Übersetzer sowohl bei der "Bestehensrate" als auch bei der "Gut-Rate" der Übersetzungsergebnisse deutliche Vorteile aufwies.
Analyse von Übersetzungsbeispielen: Fähigkeit, mit Umgangssprache, Internetbegriffen und alten Texten umzugehen
Anhand von Übersetzungsbeispielen wird die Fähigkeit von Qwen-MT demonstriert, mit verschiedenen Sprachstilen und kulturellen Hintergründen umzugehen.
Umgang mit umgangssprachlichen und informellen Ausdrücken:
- Originaltext::
Make your cubicle neat, tidy and make it a homey charm.
- Übersetzungen: machen Sie IhrunterteiltSauber und ordentlich, schafftWarm und gemütlichDie Atmosphäre.
- Originaltext::
Little study hack for y’all…
- Übersetzungen: Zueinflussreiche FamilieEin wenig lernenFinesse......
Umgang mit Internet-Schlagwörtern und Slang:
- OriginaltextAls Internet-Unternehmenlit. Ziegelsteine bewegenDarstellungen und die Verwendung der Ergebnisse zur Ableitung eigener Argumente, ist wirklichnichts Besseres zu tun haben(math.) Gattungein Genie im Rückblick (Redewendung); im Nachhinein ist man immer schlauerAnalysieren Sie es einfach nicht so sehr.
- Übersetzungen::
As a representation of **working hard** at an internet company, it's really **annoying** to use results to deduce one's own arguments. Don't overanalyze things after the fact **like a hindsight expert**.
Umgang mit kulturspezifischem Vokabular:
- Originaltext::
Kim also attended her ex's first Donda listening party...
- Übersetzungen::Kim Kardashianbesuchte auch das Debütalbum 'Donda' ihres Ex-Freundes im Mercedes-Benz Stadium in Atlanta am 22. JuliVorschau (einer Theatervorstellung).
- OriginaltextContinental Enterprises Produziert 3A Spiel Schwarzer Mythos: GokuleideninselGesucht und gelobt von Jugendlichen und Spielbegeisterten...aus **Die Reise in den Westen**...Schließlich liest jeder dieDie vier Meisterwerke** Sind chinesisch aufgewachsen.
- Übersetzungen::
The **3A game "Black Myth: Wukong"** produced by a mainland company, has been enthusiastically embraced and highly praised by young people and gaming enthusiasts **in Taiwan**...it draws inspiration from the story and characters of "**Journey to the West**"...after all, they are all Chinese who grew up reading the Four Great Classical Novels.
Der Umgang mit alten Texten:
- OriginaltextDer Qin wollte den Keks, aber der Zhao gab ihn ihm nicht, und es gab kein Unrecht zwischen den beiden. Wenn Qin die Stadt betreten wollte und Qin ihm den Keks nicht gab, war es zu Qins Gunsten; wenn Qin die Stadt verließ und die Jade zurückgab, war es zu Zhaos Gunsten.
- Übersetzungen::
Moreover, if Qin desires the jade, and Zhao refuses to give it, neither side is at fault. If Zhao gives the jade but Qin does not provide the city, the fault lies with Qin; if Qin provides the city but the jade returns to Zhao, the fault lies with Zhao.
Diese Fälle zeigen, dass das Modell nicht nur wörtliche Übersetzungen anfertigt, sondern auch den Kontext, die kulturellen Konnotationen und den sprachlichen Stil des Originaltextes bis zu einem gewissen Grad versteht und umwandelt, was für die Erstellung hochwertiger, natürlicher Übersetzungen entscheidend ist.
Liste der unterstützten Sprachen
Sprachfamilie | Sprachtyp (in einer Klassifikation) |
---|---|
Indo-europäische Sprachfamilie | Afrikaans, Armenisch, Assamesisch, Asturisch, Weißrussisch, Bengalisch, Bosnisch, Bulgarisch, Katalanisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Französisch, Galizisch, Deutsch, Griechisch, Gujarati, Hindi, Isländisch, Italienisch, Lettisch, Litauisch, Luxemburgisch, Mazedonisch, Magyar, Marathi, Mesopotamisch-Arabisch, Nepali, Schriftliches Norwegisch, Neues Norwegisch, Ocotian, Oriya, Polnisch, Portugiesisch, Rumänisch, Russisch Mazedonisch, Magahi, Marathi, Mesopotamisches Arabisch, Nepali, Schriftliches Norwegisch, Neues Norwegisch, Auk, Oriya, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch, Sizilianisch, Sindhi, Singhalesisch, Slowakisch, Slowenisch, Spanisch, Schwedisch, Toskanisches Albanisch, Ukrainisch, Urdu, Venezianisch, Walisisch, Persisch. Venezianisch, Walisisch, Persisch |
Sino-tibetische Sprachfamilie | Chinesisch (Kantonesisch, Vereinfacht, Traditionell), Birmanisch |
Afroasiatische Sprachfamilie | Arabisch (Standard, Ägyptisch, Mesopotamisch, Marokkanisch, Nezhi, Nördliche Levante, Südliche Levante, Taiz Aden, Tunesisch), Hebräisch, Maltesisch |
Austronesisch | Cebuano, Bahasa Indonesia, Javanisch, Malaiisch, Bunasinan, Tagalog, Täler |
Dravidian (allgemeine Bezeichnung für südindische Völker und Sprachen) | Kannada, Tamil, Telugu |
Türkische Sprachfamilie | Kasachisch, Nord-Aserbaidschanisch, Nord-Usbekisch, Türkisch |
Zhuang-Dong-Sprachfamilie | Thailändisch, Laotisch |
Uralische Sprachfamilie | Estnisch, Finnisch, Ungarisch |
Südasiatische Sprachfamilie | Khmer, Vietnamesisch |
Andere Sprachfamilien | Baskisch, Georgisch, Japanisch, Koreanisch, Kisuaheli |
API-Aufruf-Methoden
Der Entwickler kann seine Arbeit erleichtern, indem er die Kompatibilität mit dem OpenAI
API-Format, sind die folgenden einige offiziell vorgesehen Python
Beispiel.
Einfache Übersetzung:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [
{
"role": "user",
"content": "我看到这个视频后没有笑"
}
]
translation_options = {
"source_lang": "auto",
"target_lang": "English"
}
completion = client.chat.completions.create(
model="qwen-mt-turbo",
messages=messages,
extra_body={
"translation_options": translation_options
}
)
print(completion.choices.message.content)
Verwendung von terminologischen Interventionen:
Für Übersetzungen in Fachgebieten der terms
Übersetzungsergebnisse für parametrisierte vordefinierte Terminologie, um die Genauigkeit des Fachvokabulars zu gewährleisten.
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [
{
"role": "user",
"content": "而这套生物传感器运用了石墨烯这种新型材料,它的目标物是化学元素,敏锐的“嗅觉”让它能更深度、准确地体现身体健康状况。"
}
]
translation_options = {
"source_lang": "Chinese",
"target_lang": "English",
"terms": [
{
"source": "生物传感器",
"target": "biological sensor"
},
{
"source": "石墨烯",
"target": "graphene"
},
{
"source": "化学元素",
"target": "chemical elements"
},
{
"source": "身体健康状况",
"target": "health status of the body"
}
]
}
completion = client.chat.completions.create(
model="qwen-mt-turbo",
messages=messages,
extra_body={
"translation_options": translation_options
}
)
print(completion.choices.message.content)
# 预期输出:
# This biological sensor uses graphene, a new material, and its target is chemical elements. Its sensitive "nose" can more deeply and accurately reflect the health status of the body.
Geben Sie den Bereich und den Stil an:
passieren (eine Rechnung oder Inspektion etc.) domains
Parameter können natürlichsprachliche Hinweise liefern, die das Modell anleiten, einen domänenspezifischen Schreibstil für die Übersetzung zu wählen.
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [
{
"role": "user",
"content": "第二个SELECT语句返回一个数字,表示在没有LIMIT子句的情况下,第一个SELECT语句返回了多少行。"
}
]
translation_options = {
"source_lang": "Chinese",
"target_lang": "English",
"domains": "The sentence is from Ali Cloud IT domain. It mainly involves computer-related software development and usage methods, including many terms related to computer software and hardware. Pay attention to professional troubleshooting terminologies and sentence patterns when translating. Translate into this IT domain style."
}
completion = client.chat.completions.create(
model="qwen-mt-turbo",
messages=messages,
extra_body={
"translation_options": translation_options
}
)
print(completion.choices.message.content)
# 预期输出:
# The second SELECT statement returns a number that indicates how many rows were returned by the first SELECT statement without LIMIT clause.