大模型 & 具身智能双赛道要闻速览|2026.06.10

大模型 & 具身智能双赛道要闻速览|2026.06.10

本期6条要闻:Anthropic Claude Fable 5全面商用(降价超50%,含Mythos 5向200家机构开放);Google同日推出DiffusionGemma(文本扩散架构,速度最高4倍)和Gemini 3.5 Live Translate(70+语言实时语音互译);快手可灵AI两周年全球用户破亿;美团AI浏览器Tabbit 1.0正式上线;乐聚机器人被抽中现场检查,成创业板第四套标准首申机器人企业。

大模型 & 具身智能行业要闻
2026/6/11 · 8:05
1 订阅 · 10 内容

研究速览

本期覆盖时间窗口:2026 年 6 月 10 日。共 6 条要闻:Anthropic Claude Fable 5 全面商用并大幅降价;Google 同日推出 DiffusionGemma 和 Gemini 3.5 Live Translate 两款开放模型;快手可灵 AI 两周年全球用户破亿;美团 AI 浏览器 Tabbit 1.0 正式上线;乐聚机器人创业板 IPO 迎新进展。

一、Anthropic Claude Fable 5 全面商用,Mythos 5 向 200 家机构开放

Anthropic 于 6 月 9 日同步发布 Claude Fable 5Claude Mythos 5 两款旗舰模型,是继 4 月底 Mythos Preview 内测后首次面向大众的完整商用版本1
Fable 5 定位为「有防护措施的 Mythos 级通用模型」——在软件工程、知识工作、视觉、科学研究等几乎所有基准测试中达到 SOTA,同时对网络安全类查询通过硬性过滤保护,相关请求自动转给 Opus 4.8 处理。Stripe 的内测报告显示,Fable 5 在一个 5000 万行 Ruby 代码库中一天完成了整队手工两个月才能完成的迁移。在 Cognition 发布的 FrontierCode 编程评测(由 20+顶级开源维护者手工制题)中,Fable 5 得分居前沿模型之首。
Mythos 5 是同一底座模型、但解除网络安全限制的版本,通过 Project Glasswing 向约 200 家网络防御机构和关键基础设施提供商开放。在药物设计场景,Mythos 5 让 Anthropic 内部蛋白质设计流程加速约 10 倍——14 个蛋白质靶点中有 9 个产出了可进一步研究的候选分子。
定价:Fable 5 和 Mythos 5 统一定为 $10/百万输入 token、$50/百万输出 token,比 Claude Mythos Preview 降价超 50%。
Claude Fable 5 与前沿模型的基准测试对比表
Fable 5 在软件工程、知识工作、视觉等多项能力的横向对比 1

二、Google DiffusionGemma:文本扩散架构,生成速度最高提升 4 倍

Google DeepMind 在 6 月 10 日发布实验性开放模型 DiffusionGemma,采用扩散(Diffusion)架构生成文本,而非传统 LLM 的逐 token 自回归预测2
传统自回归模型每次只生成一个 token,速度受限于序列长度。DiffusionGemma 将 256 个 token 打包成一个块并行生成,在专用 GPU 上可实现约 1479 tokens/秒,最高比同参数量传统 Gemma 快 4 倍3。模型参数量 26B(MoE 架构),以 Apache 2.0 许可开源。
代价是整体基准测试精度低于标准 Gemma 4 同档——Google 认为这对代码补全、行内编辑等对速度敏感但任务粒度较小的场景是合理取舍。NVIDIA 同日发布了针对 DiffusionGemma 的本地加速支持4
这是继 Gemini Diffusion 研究论文之后,Google 首次将文本扩散架构以可部署开放模型的形式落地,意味着「快但略差」的生成路线开始进入工程验证阶段。
正在加载统计卡片…

三、Google Gemini 3.5 Live Translate 上线,支持 70+语言实时语音互译

同样在 6 月 10 日,Google DeepMind 发布 Gemini 3.5 Live Translate,一款专为低延迟跨语言口语交流设计的实时音频模型5
与现有机器翻译工具的主要差别在于它是「流式语音到语音」而非「录音后处理」——双方可以持续说话,模型在低延迟下完成双向翻译,并保留原始语音的语气和节奏,不输出机械腔文本再转语音。上线即覆盖 70+语言,已接入 Google Meet、Google Translate 应用和 Google AI Studio 开发者 API。
这使得不同语言使用者之间的实时语音通话,在技术层面基本消除了翻译等待的断点感。对于企业跨境会议、国际客服等场景,延迟降低的实际意义要比翻译准确率的提升更直接。

四、可灵 AI 两周年:全球用户破 1 亿,3.0 系列上线

快手旗下视频生成平台可灵 AI于近日公布两周年运营数据:截至 2026 年 6 月,全球用户突破 1 亿,较 2025 年底的 6000 万增长约 67%,覆盖 224 个国家和地区;企业客户近 5 万家,较 2025 年底的 3 万家增长约 67%6
配合周年纪念,可灵 AI 同步推出 3.0 系列模型,进一步拓展影像叙事能力。受此消息驱动,当日港股快手涨约 3.8%,逆势跑赢整体大模型概念股板块(整体当日承压)7
1 亿用户意味着可灵 AI 在全球视频生成工具市场的覆盖面已超过 Runway 和 Pika Labs 等海外竞对过去数年积累的用户规模;但从已披露的 Q1 营收(6.5 亿元)来看,变现仍以专业和企业客户为主,C 端用户的付费转化率尚待验证。快手此前已披露拟对可灵 AI 进行拆分重组,引入外部战略融资,并目标 2027 年初赴港独立上市。
正在加载统计卡片…

五、美团 Tabbit 1.0 正式上线:AI 浏览器杀入互联网入口争夺

6 月 9 日,美团旗下 GN06 团队正式发布 AI 原生浏览器 Tabbit 1.08,距今年 3 月公测过去 100 天,AI Agent 任务完成率从公测初的 53.1%升至 90.8%,基础任务 10 秒内响应9
Tabbit 内置 DeepSeek、LongCat、智谱 GLM、Kimi 等多款国内主流大模型,用户输入自然语言需求后,可自动执行跨软件、跨网页的复杂任务,包括表单填写、数据提取、内容整理。1.0 商业化方案:标准版永久免费,专业版每周 9.9 元。
国内「AI 浏览器」这条路上,之前有 360、字节、腾讯各自的布局,美团切入的时机较晚,但以自研 LongCat 大模型为内核的 Agent 能力,把「任务完成」而非「信息检索」定为核心场景,是一种差异化路径。目前最大的问题是用户习惯迁移——切换浏览器的门槛历来很高,美团在这上面并无先天优势。

六、乐聚机器人创业板 IPO:被抽中现场检查,首单「第四套标准」申报

具身智能赛道的上市进程中,乐聚机器人(乐聚智能)成为近期焦点。公司于 5 月 19 日在深交所创业板提交 IPO 申请获得受理,成为国内首家按创业板第四套上市标准申请上市的人形机器人企业——该标准专为研发投入大、盈利周期长的前沿科技企业设立10
本次拟募资26 亿元,投向人形机器人产业化基地、具身智能研发中心、高质量大规模数据集建设等四个方向。2025 年营收 2.58 亿元,同比增 365.2%,但 2023–2025 年净亏损持续扩大(从 4111 万元扩大至更大规模),尚未实现盈利11
近日,中国证券业协会宣布乐聚智能被抽中现场检查,这是 IPO 审核中的一个正常环节,但会延长审核周期。同一时期冲刺 A 股的具身智能企业还包括宇树科技(已过会,科创板)、云深处、星海图等,乐聚成为第一个测试「第四套标准」这一绿色通道的机器人公司,其审核结果对后续申报者具有参考意义。

快讯 小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro UltraSpeed 模式,1 trillion 参数旗舰模型输出速度首破 1000 tokens/s(FP4 混合量化 + 块级并行推测解码),API 限时开放至 6 月 23 日,定价为标准版 3 倍12

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。