海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI新闻

阿里云推出 Qwen-MT 翻译模型,以 MoE 架构切入低延迟、低成本市场

2025-07-25 17

阿里云近日发布了其最新的机器翻译模型 Qwen-MT,该模型基于其 Qwen3 系列大语言模型开发,并通过 API(qwen-mt-turbo)向开发者和企业用户开放。与追求模型参数规模的路线不同,Qwen-MT 采用了轻量级的 MoE(Mixture of Experts)架构,意在为市场提供一种在翻译质量、响应速度和调用成本之间取得平衡的解决方案。

核心亮点:性能、成本与可控性

Qwen-MT 的核心特性主要体现在三个方面:

  • 广泛的语言支持:该模型支持 92 种语言和重要方言间的互译,覆盖范围包括印欧、汉藏、亚非、南岛等多个语系,号称可服务全球 95% 以上的人口。
  • 低延迟与低成本:得益于 MoE 架构,模型在处理翻译任务时无需调用全部参数,从而实现了更快的推理速度。官方公布的 API 价格为每百万输出 token 低至 2 元人民币,这一定价策略使其在需要处理大规模、高并发翻译请求的场景中具备显著的成本优势。
  • 专业场景下的可控性:除了基础翻译功能,Qwen-MT 还提供术语干预、领域提示和翻译记忆库等高级功能。用户可以通过自定义提示词,引导模型在特定行业(如法律、金融、医疗)或复杂语境下生成更精准、更符合规范的译文。

性能评估:对标主流模型

根据阿里云公布的自动评测和人工评测数据,Qwen-MT 的翻译表现值得关注。

在自动评估环节,涵盖中英、英德多领域翻译及 WMT24 多语言翻译任务的测试结果显示,Qwen-MT 的性能优于 GPT-4.1-mini、Gemini-2.5-Flash 等同规模模型。同时,其翻译效果据称可与 GPT-4.1、Gemini-2.5-Pro 等顶级大模型媲美。

自动评估结果

考虑到自动评测的局限性,该公司还针对中文、英语、日语、韩语等十种主要语言,组织了基于真实应用场景的人工评测。评测结果显示,在由专业译员进行的独立评分中,Qwen-MT 在翻译结果的“合格率”和“优良率”上均表现出明显优势。

人工评估结果1

人工评估结果2

翻译样例分析:处理口语、网络用语和古文的能力

提供的翻译样例展示了 Qwen-MT 在处理不同语言风格和文化背景时的能力。

处理口语化和非正式表达:

  • 原文Make your cubicle neat, tidy and make it a homey charm.
  • 译文:让你的隔间整洁有序,营造出温馨舒适的氛围。
  • 原文Little study hack for y’all…
  • 译文:给大家一个学习小技巧……

处理网络流行语和俚语:

  • 原文:作为互联网公司搬砖的表示,用结果来推导自己的论点,真是闲得蛋疼马后炮事后诸葛亮就别分析那么多。
  • 译文As a representation of **working hard** at an internet company, it's really **annoying** to use results to deduce one's own arguments. Don't overanalyze things after the fact **like a hindsight expert**.

处理文化特定词汇:

  • 原文Kim also attended her ex's first Donda listening party...
  • 译文金·卡戴珊也于7月22日出席了她前男友在亚特兰大的梅赛德斯-奔驰体育场举行的首场《Donda》专辑试听会
  • 原文:大陆企业出品的 3A游戏《黑神话:悟空》,受到岛内青年、游戏爱好者的追捧和好评…取材于**《西游记》…毕竟大家都是读着四大名著**长大的中国人。
  • 译文The **3A game "Black Myth: Wukong"** produced by a mainland company, has been enthusiastically embraced and highly praised by young people and gaming enthusiasts **in Taiwan**...it draws inspiration from the story and characters of "**Journey to the West**"...after all, they are all Chinese who grew up reading the Four Great Classical Novels.

处理古文:

  • 原文:且夫秦欲璧,赵弗予璧,两无所曲直也。入璧而秦弗予城,曲在秦;秦出城而璧归,曲在赵。
  • 译文Moreover, if Qin desires the jade, and Zhao refuses to give it, neither side is at fault. If Zhao gives the jade but Qin does not provide the city, the fault lies with Qin; if Qin provides the city but the jade returns to Zhao, the fault lies with Zhao.

这些案例表明,该模型不仅能进行字面翻译,还在一定程度上理解并转换了原文的语境、文化内涵和语言风格,这对于生成高质量、自然的译文至关重要。

支持语种列表

语系 语种
印欧语系 南非荷兰语,亚美尼亚语,阿萨姆语,阿斯图里亚斯语,白俄罗斯语,孟加拉语,波斯尼亚语,保加利亚语,加泰罗尼亚语,克罗地亚语,捷克语,丹麦语,荷兰语,英语,法语,加利西亚语,德语,希腊语,古吉拉特语,印地语,冰岛语,意大利语,拉脱维亚语,立陶宛语,卢森堡语,马其顿语,马加希语,马拉地语,美索不达米亚阿拉伯语,尼泊尔语,书面语挪威语,新挪威语,奥克语,奥里亚语,波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语,西西里语,信德语,僧伽罗语,斯洛伐克语,斯洛文尼亚语,西班牙语,瑞典语,托斯克阿尔巴尼亚语,乌克兰语,乌尔都语,威尼斯语,威尔士语,波斯语
汉藏语系 中文(粤语、简体、繁体),缅甸语
亚非语系 阿拉伯语(标准、埃及、美索不达米亚、摩洛哥、内志、北黎凡特、南黎凡特、塔伊兹-亚丁、突尼斯),希伯来语,马耳他语
南岛语系 宿务语,印度尼西亚语,爪哇语,马来语,邦阿西楠语,他加禄语,瓦莱语
达罗毗荼 卡纳达语,泰米尔语,泰卢固语
突厥语系 哈萨克语,北阿塞拜疆语,北乌兹别克语,土耳其语
壮侗语系 泰语,老挝语
乌拉尔语系 爱沙尼亚语,芬兰语,匈牙利语
南亚语系 高棉语,越南语
其它语系 巴斯克语,格鲁吉亚语,日语,韩语,斯瓦希里语

API 调用方法

开发者可以通过兼容 OpenAI 的 API 格式进行调用,以下是几个官方提供的 Python 示例。

基础翻译:

import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [
{
"role": "user",
"content": "我看到这个视频后没有笑"
}
]
translation_options = {
"source_lang": "auto",
"target_lang": "English"
}
completion = client.chat.completions.create(
model="qwen-mt-turbo",
messages=messages,
extra_body={
"translation_options": translation_options
}
)
print(completion.choices.message.content)

使用术语干预:

对于专业领域的翻译,可以通过 terms 参数预设术语的翻译结果,确保专业词汇的准确性。

import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [
{
"role": "user",
"content": "而这套生物传感器运用了石墨烯这种新型材料,它的目标物是化学元素,敏锐的“嗅觉”让它能更深度、准确地体现身体健康状况。"
}
]
translation_options = {
"source_lang": "Chinese",
"target_lang": "English",
"terms": [
{
"source": "生物传感器",
"target": "biological sensor"
},
{
"source": "石墨烯",
"target": "graphene"
},
{
"source": "化学元素",
"target": "chemical elements"
},
{
"source": "身体健康状况",
"target": "health status of the body"
}
]
}
completion = client.chat.completions.create(
model="qwen-mt-turbo",
messages=messages,
extra_body={
"translation_options": translation_options
}
)
print(completion.choices.message.content)
# 预期输出:
# This biological sensor uses graphene, a new material, and its target is chemical elements. Its sensitive "nose" can more deeply and accurately reflect the health status of the body.

指定领域与风格:

通过 domains 参数可以提供自然语言提示,引导模型采用特定领域的文风进行翻译。

import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
messages = [
{
"role": "user",
"content": "第二个SELECT语句返回一个数字,表示在没有LIMIT子句的情况下,第一个SELECT语句返回了多少行。"
}
]
translation_options = {
"source_lang": "Chinese",
"target_lang": "English",
"domains": "The sentence is from Ali Cloud IT domain. It mainly involves computer-related software development and usage methods, including many terms related to computer software and hardware. Pay attention to professional troubleshooting terminologies and sentence patterns when translating. Translate into this IT domain style."
}
completion = client.chat.completions.create(
model="qwen-mt-turbo",
messages=messages,
extra_body={
"translation_options": translation_options
}
)
print(completion.choices.message.content)
# 预期输出:
# The second SELECT statement returns a number that indicates how many rows were returned by the first SELECT statement without LIMIT clause.

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文