腾讯混元发布 Hy-MT1.5:1.25-bit 量化,3.3GB 翻译模型压到 440MB 跑在老手机上

腾讯混元开源极致量化翻译模型 Hy-MT1.5-1.8B-1.25bit,3.3GB 压至 440MB,可在骁龙865等老旧手机上离线运行,支持33种语言+5方言,翻译质量媲美商业 API。

리서치 브리프

封面
封面
腾讯混元开源了一个翻译模型:Hy-MT1.5-1.8B-1.25bit1。参数量 1.8B,看起来普通——但「1.25-bit 量化」这个数字值得停下来想一想。
产品名称:Hy-MT1.5-1.8B-1.25bit 产品类别:端侧离线翻译模型 发布方:腾讯混元 发布时间:2026年4月30日

3.3GB 压成 440MB

常规的 1.8B 模型,权重文件大约 3.3GB。装进手机已经勉强,实时推理更是奢望。Hy-MT1.5 通过极致量化把这个数字砍到 440MB,体积缩减约 87%1
正在加载统计卡片...
量化精度压到 1.25-bit,在模型压缩领域属于相当激进的做法——通常低于 2-bit 时,翻译质量会出现肉眼可见的劣化。腾讯混元给出的说法是:翻译质量媲美商业 API 和 235B 超大模型1。这个说法够大胆,具体质量如何,等独立评测跟进更有说服力。

骁龙 865 能跑

Hy-MT1.5 明确支持骁龙 865 等老芯片设备离线运行1。骁龙 865 是 2020 年的芯片,如今仍是相当数量用户手里的主力机。离线翻译不再是旗舰机专属,这个门槛降得很实际。
语言覆盖方面,33 种语言加上 5 种方言,与主流在线翻译 API 基本持平。

翻译内容不上传服务器

完全离线意味着翻译内容不经过任何服务器。合同、医疗记录、私人对话——这些场景下,隐私的价值不比翻译速度低。这是在线 API 给不了的差异点。
腾讯混元称这款模型实现了「既好用又省资源」的设计目标1

原文关键金句

「翻译质量媲美商业 API 和 235B 超大模型,可在骁龙 865 等老芯片手机离线运行。」1

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.