腾讯混元面向端侧场景开源翻译模型1.5，效果超越商用API

财经涂鸦 2026-01-01 01:04 3069阅读

公司情报专家《财经涂鸦》获悉，12月30日，腾讯混元宣布推出并开源翻译模型1.5。

其中共包含两个模型：Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。两个模型均支持 33个语种互译以及5种民汉/方言，除中文、英语、日语等常见语种外，也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

目前模型已在腾讯混元官网上线，通过开源社区也可以直接下载使用。

据了解，HY-MT1.5-1.8B主要面向手机等消费级设备场景，经过量化，可支持端侧直接部署和离线实时翻译，仅需1GB内存即可流畅运行，并且在参数量极小的前提下，效果超过了大部分商用翻译API。

模型在效率和性价比也表现突出，与主流商用翻译模型API对比，HY-MT1.5-1.8B 推理速度更快，处理50个tokens的平均耗时只有0.18秒，其他模型的时间在0.4秒左右。

HY-MT1.5-7B 模型效果相比前一版本有较大提升，是此前获得WMT25比赛30个语种翻译冠军模型的升级版，重点提升了翻译准确率，大幅减少了译文中夹带注释和语种混杂的情况，实用性进一步增加。

在部分用户实用场景下，混元翻译1.8B和7B两个尺寸模型同时使用，可以实现端侧和云侧模型的协同部署，提升模型的效果的一致性和稳定性。

针对各类场景，两个模型均实现了对术语库、长对话、带格式文本（例如网页）的翻译支持，更加全面。

首先是术语，腾讯混元翻译模型1.5具备强大的术语库自定义能力，用户可针对不同行业与专业场景（如医学、法律、金融、科技等）提前构建专属术语对照表，确保关键术语在翻译中保持高度一致与准确性。这一功能有效弥补了小尺寸模型在处理专业领域文本时的词汇短板。

其次是上下文翻译。混元翻译模型模型具备先进的长文本与对话上下文理解能力，可基于前文语境持续优化后续翻译结果，显著提升长对话、多轮问答、连续段落等场景下的翻译连贯性与一致性。

第三是，带格式翻译能力，通过精准的指令遵循能力，混元翻译模型得以保持翻译前后的格式信息不变，让翻译结果更加准确实用。

此前，腾讯混元翻译模型不仅在国际机器翻译比赛拿下30个第1名，也在首次开源一周内便登上了HuggingFace 模型趋势榜第一位。

目前，混元翻译模型已经在腾讯内部多个业务场景落地应用，包括腾讯会议、企业微信、QQ浏览器、客服翻译等。此外，为了便于开发者使用，本次开源的模型已经在 Github 和 Huggingface 等开源社区上线，Arm、高通、Intel、沐曦等多个平台均支持部署。

作者：苏打

编辑：tuya

出品：财经涂鸦（ID：caijingtuya）

追加内容

本文作者可以追加内容哦 !

本文来源：财经涂鸦

来源：财经涂鸦

财经涂鸦

重要提示： 本文仅代表作者个人观点，并不代表乐居财经立场。本文旨在为满足广大用户的信息需求而采集提供，并非商业性或盈利性用途。任何单位或个人认为本文来源标注有误，或涉嫌侵犯其知识产权等相关权利的，请提供身份证明、权属证明及详细侵权情况证明等相关资料，点击【联系客服】或发邮件至【ljcj@leju.com】，我们将及时审核处理。