智东西
智东西12月30日报说念,刚刚,腾讯混元开源翻译模子1.5版块,共包含两个模子:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,复旧33个语种互译以及5种民汉/方言,除了汉文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

▲Tencent-HY-MT1.5-1.8B开源(开首:Hugging Face)

▲Tencent-HY-MT1.5-7B开源(开首:Hugging Face)
HY-MT1.5-1.8B主要面向手机等破钞级引诱场景,复旧端侧径直部署和离线及时翻译,仅需1GB内存即可畅达驱动。
HY-MT1.5-7B模子是此前获取WMT25比赛30个语种翻译冠军模子的升级版,要点晋升了翻译准确率,大幅减少了译文中夹带属目和语种夹杂的情况,实用性进一步增多。
在部分用户内容使用场景下,混元翻译1.8B和7B两个尺寸模子同期使用,不错已毕端侧和云侧模子的协同部署,晋升模子的效果的一致性和结识性。
基准测试方面,在中外互译和英外互译测试集Flores200、WMT25以及民汉话语的测试聚拢,Tencent-HY-MT1.5-1.8B全面卓绝Qwen3-32B,与Qwen3-235B-A22B等大尺寸闭源模子成绩不相转折。
同期,在处分效劳上,与主流商用翻译模子API对比,HY-MT1.5-1.8B处分50个tokens的平均耗时独一0.18秒,其他模子的时候在0.4秒傍边。
时间方面,HY-MT1.5-1.8B大约用小尺寸已毕大尺寸模子的效果,收货于On-Policy Distillation(大尺寸模子蒸馏)政策的引入,HY-MT1.5-7B手脚Teacher,大约及时指点1.8B的Student模子,让其幸免死记硬背圭表谜底,通过校正在展望序列分别时的偏移,让小模子从造作中学习,进而晋升才调。

▲On-Policy Distillation(大尺寸模子蒸馏)政策(开首:腾讯混元)
当今两个模子均已在腾讯混元官网上线,在GitHub和Hugging Face等开源社区也可径直下载使用,Arm、高通、Intel、沐曦等多个平台均复旧部署。
混元官网:
https://hunyuan.tencent.com/modelSquare/home/list
GitHub聚拢:
https://github.com/Tencent-Hunyuan/HY-MT
Hugging Face聚拢:
https://huggingface.co/collections/tencent/hy-mt15
一、互译成绩卓绝Qwen3-32B,反应速率仅0.18秒在常用的中外互译和英外互译测试集Flores200、WMT25以及民汉话语的测试聚拢,Tencent-HY-MT1.5-1.8B全面卓绝Qwen3-32B等中等尺寸开源模子和主流商用翻译API,达到Qwen3-235B-A22B等大尺寸闭源模子的90分位水平。

▲Flores200、WMT25以及民汉话语的测试集成绩(开首:腾讯混元)
在翻译质料与反应效劳上,HY-MT1.5-1.8B模子在FLORES-200质料评估中取得了约78%的分数,同期平均反适时候仅为0.18秒,卓绝主流商用翻译API。

▲FLORES-200质料评估成绩(开首:腾讯混元)
二、从医学术语到粤语对话,腾讯混元翻译模子1.5反应迅捷、准确率“能打”凭借优化的模子策画和推理逻辑,腾讯混元翻译模子1.5适用于即时通信、智能客服、出动翻译旁边等高隐隐、及时翻译场景。
率先是术语,腾讯混元翻译模子1.5具备术语库自界说才调,用户可针对不同业业与专考场景(如医学、法律、金融、科技等)提前构建专属术语对照表,确保要津术语在翻译中保执高度一致与准确性。
这一功能有用弥补了小尺寸模子在处分专科规模文本时的词汇短板,使其在保险轻量化部署的同期,也能胜任高条件的行业翻译任务。
用户可通过率性建树导入术语库,模子将在翻译进程中优先收受用户界说的圭表术语,从而晋升专科文档、时间手册、协议文本等内容翻译的可靠性与泰斗性。
▲术语翻译(开首:腾讯混元)
智东西也上手尝试了一下,咱们上传了一系列医学术语,让其翻译成汉文。在反应速率上,腾讯混元翻译模子1.5就很快输出了翻译截止,实在莫得反适时候。与原文对看管,其翻译的恶果准确度为100%。

▲术语翻译(开首:智东西实测)
除了英语外,咱们还上传了5句职场中高频出现的粤语对话,望望腾讯混元翻译模子1.5的方言翻译效果若何。截止表现,腾讯混元翻译模子1.5也不错很准确地翻译出粤语用词和语气,准确度通常“能打”。

▲粤语翻译(开首:智东西实测)
其次是转折文翻译才调。该才调适用于及时对话翻译、长篇文件翻译及多轮交互场景。混元翻译模子模子具备较好的长文本与对话转折文通晓才调,可基于前文语境执续优化后续翻译截止,显耀晋升长对话、多轮问答、一语气段落等场景下的翻译连贯性与一致性。
无论是会议记载、访谈内容、演义章节照旧时间文档的长篇翻译,模子均能有用捕捉并保执转折文逻辑联系,幸免出现指代不清、语义断裂或立场不谐和的问题。
▲转折文翻译(开首:腾讯混元)
第三是,带要领翻译才调,通过精确的辅导遵照才调,混元翻译模子得以保执翻译前后的要领信息不变,让翻译截止愈加准确乎用。
▲要领翻译(开首:腾讯混元)
为了直不雅展示混元Tencent-HY-MT1.5-1.8B的翻译效果,底下展示了与苹果手机自带离线翻译的截止对比:

▲与苹果自带翻译对比(开首:腾讯混元)
结语:腾讯开源裁汰了翻译模子旁边门槛腾讯这次开源的小尺寸翻译模子,裁汰了翻译模子在手机等末端上驱动的门槛。
腾讯混元翻译模子此前不仅在海外机器翻译比赛拿下30个第1名,也在初度开源一周内便登上Hugging Face模子趋势榜第一位。
混元翻译模子照旧在腾讯里面多个业务场景落地旁边,包括腾讯会议、企业微信、QQ浏览器、客服翻译等。