AI OS 周报 #001|苹果 Siri 大重建、微软 Agent 优先、谷歌全栈渗透、鸿蒙进入 Agent 时代

AI OS 周报 #001|苹果 Siri 大重建、微软 Agent 优先、谷歌全栈渗透、鸿蒙进入 Agent 时代

本期覆盖 2026 年 6 月 3–13 日 AI OS 生态集中引爆周:苹果 WWDC26 发布 Siri AI 并押注谷歌 Gemini 做模型路由层;微软 Build 2026 以七款 MAI 自研模型宣告「零蒸馏」独立,Windows 正式向智能体平台转型;谷歌 Pixel 10 + Tensor G5 将 Gemini Nano 常驻端侧,月活破 9 亿;华为 HDC 2026 发布 HarmonyOS 7 并提出 Agent 亲和架构。四条路线首次在同一窗口内同台亮相,AI OS 赛道从演示迈向真实交付。

AI OS 发展动态
2026/6/13 · 10:26
購読 1 件 · コンテンツ 1 件

リサーチノート

本期为频道创建首发,时间窗口覆盖 2026 年 6 月 3 日至 6 月 13 日,梳理该窗口内 AI OS 生态的重要进展。后续各期将严格按每周时间窗滚动发布。

六月上旬,AI OS 赛道迎来集中引爆:苹果 WWDC26 落幕、微软 Build 2026 收场,谷歌 Pixel 10 系列上市,华为 HDC 2026 接力开幕——四大玩家在同一个月窗口内集体亮牌。这一局面不是偶然,而是端侧 AI 能力从「演示」向「交付」过渡的临界信号。
本期重点追踪四条主线:苹果 Siri 重建的内部代价与技术路线;微软 Windows 如何从「应用平台」转型「智能体平台」;谷歌如何用芯片+系统+模型三层垂直整合占据 Android 制高点;华为鸿蒙 7 如何将 Agent 架构写入系统底层。

苹果 WWDC26:Siri 终于不拉胯了,但代价是向谷歌买单

北京时间 6 月 9 日凌晨,蒂姆·库克主持了他最后一届 WWDC 主题演讲,发布了 iOS 27 / iPadOS 27 / macOS 27 等系统以及 Siri 重建后的新形态——苹果官方将其命名为「Siri AI」。1

Siri AI:五项核心能力重塑交互逻辑

新 Siri 具备五项系统级能力:个人情境理解、图像理解、世界知识检索、屏幕感知以及跨 App 调用。两个最受关注的演示场景,一是识别照片里的地标并串联地图、好友聊天记录完成导航规划;二是跨越世界杯赛程、联系人通讯记录和全球美食信息,一句指令生成派对菜单并群发邀请。全程不需要手动切换 App。2
灵动岛(Dynamic Island)也升级为 Siri 的核心入口:唤醒后弹出「搜索或提问」药丸形输入栏;往下滑则进入带历史记录的对话界面。苹果还推出了 Siri 的独立 App,这是 iPhone 历史上首次为语音助手提供完整的应用程序入口。
苹果 Siri AI 与神经网络架构示意
Siri AI 底层连接苹果端侧模型与谷歌 Gemini 云端模型,形成统一模型路由层 1

底层架构:苹果放弃自研大模型,押注谷歌 Gemini

这次升级的技术核心,是苹果把 Siri 和 Apple Intelligence 的云端基础层切换到了谷歌 Gemini——据多家媒体报道,苹果每年为此向谷歌支付约 10 亿美元。3 端侧推理则由苹果自研的 Apple Foundation Models 承担。
苹果同时宣布 Foundation Models Framework 升级为统一模型路由层:开发者可以调用苹果端侧模型、Private Cloud Compute 云端模型,或 Gemini、Claude 等第三方模型——苹果的定位由「做最好的模型」转向「做最好的模型分发入口」。苹果还在测试 Extensions 系统,未来用户可以将 ChatGPT、Qwen、Kimi 等设为 Siri 的默认回答引擎。4

硬件门槛与地区限制

苹果最强的端侧模型(AFM Core Advanced)门槛更高:iPhone 端限定 iPhone Air、iPhone 17 Pro 系列;iPad 端要求 M5 及以上芯片且配备 12GB 内存;Mac 端需 M3 或更新。iPhone 16 Pro Max、M1 MacBook 等设备仍可获得 Siri AI 的大部分功能,但无法使用「高度自定义语音」和「显著提升的语音听写」这两项依赖高端本地模型的特性。5
地区方面,Siri AI 暂不在中国大陆上线(受监管要求),欧盟地区初期也不登陆 iOS / iPadOS。

其他值得关注的 iOS 27 功能

  • 重构画面(Reframe):借助空间照片技术分析景深,允许后期调整构图角度,生成式 AI 自动填充边缘区域。
  • 自然语言快捷指令:用口语描述需求,系统自动在「快捷指令」App 中完成工作流搭建。
  • Safari 智能摘要家庭场景联动 等散装 AI 功能遍布系统各处。

微软 Build 2026:Windows 向「智能体平台」转型,Copilot+ 标签悄然淡化

6 月 3 日,微软 Build 2026 开发者大会在凌晨 0 点 30 分开幕。纳德拉的开幕语确定了本届大会的基调:「企业不应再只是消费前沿模型,而应当全面参与前沿模型生态系统的建设。」6

自研模型 MAI 家族:七款一次发布

微软在本届大会上发布了七款 MAI 自研模型,覆盖推理、代码、图像、语音、转录五大能力方向——彻底回应了「微软只是 OpenAI 套壳」的市场质疑。
核心旗舰是 MAI-Thinking-1:350 亿活跃参数(MoE 架构,总规模接近万亿),支持 256K 上下文,强调「从零训练、零蒸馏」,不依赖第三方模型输出训练。微软 AI 负责人穆斯塔法·苏莱曼描述其目标是:「构建一台持续靠计算量、数据和评估自我改进的爬山机器。」7
代码侧,MAI-Code-1-Flash(5B 参数)即时集成进 GitHub Copilot 和 VS Code,声称在处理高难度问题时 Token 消耗最高可比同定位模型低 60%。图像侧,MAI-Image-2.5 支持生成 4K 分辨率内容,Flash 版本针对移动端与低算力设备优化。

Windows 系统级变革:智能体成为「一等公民」

Windows 的核心交互逻辑正在被重写。微软将智能体能力嵌入 Windows Terminal,开发者无需切换聊天窗口即可在命令行里调用 AI 完成代码编写、调试和复杂任务执行。Linux 容器能力也被直接整合进 Windows,供智能体调用。
Project Solara 是一个全新面向智能体设备的操作系统,定位是「AI 原生 OS」,瞄准后智能手机时代的新设备形态。Microsoft Execution Containers(MXC)则为智能体提供安全沙箱隔离机制,支持企业级部署。
硬件侧,Surface RTX Spark Dev Box 是一款面向开发者的迷你主机,搭载 Arm 架构 CPU + Blackwell GPU + 128GB 统一内存,可本地运行最高 1200 亿参数的大模型。
AI 处理器芯片与端侧计算架构
Surface RTX Spark Dev Box 搭载 Blackwell GPU + 128GB 统一内存,代表微软将高算力本地 AI 推向开发者工作站 7

Copilot+ 品牌悄然收缩,GPU 机器开放本地 AI

一个值得关注的信号:微软在 6 月 11 日更新了 GitHub 文档,宣布 Windows 11 的本地语言模型 API 不再限定于 Copilot+ PC(此前要求内置 NPU),只要系统配备至少 6GB 显存的 NVIDIA GeForce RTX 30 系列或更新显卡,即可运行本地 AI 工作负载。此次开放的 API 由微软的小型语言模型 Phi Silica 驱动,支持文本格式化、摘要、改写、转表格等功能。8
这一动作意味着 Copilot+ 品牌的「NPU 独占」护城河正在被主动拆除。结合苹果将模型路由对外开放,AI OS 硬件门槛的全面下探已成趋势。

谷歌:Gemini Nano 常驻端侧,Android 生态全面渗透

谷歌在本周期内的推进路线是「垂直整合到底」——从大模型到芯片到操作系统到手机,每层自研。

Pixel 10 + Tensor G5:芯片把 AI 写进硬件层

Pixel 10 系列搭载的 Tensor G5,是谷歌首次完全摆脱三星代工、转投台积电 3nm 的产物。TPU(谷歌的 NPU 等效单元)性能较前代提升 60%,CPU 多核性能提升 20%–35%。Gemini Nano 被直接常驻在这颗芯片上,无需联网即可完成上下文建议、文本摘要、实时翻译、语音增强等超过 20 项本地 AI 功能。4
CPU 处理器芯片架构与 AI 推理模块示意
Tensor G5 TPU 较前代提升 60%,Gemini Nano 常驻端侧代表谷歌「模型到芯片到系统」垂直整合路线 4

Gemini App 月活破 9 亿,Gemini Go 下沉低端机

6 月 4 日,Alphabet 在投资者演示中披露:Gemini App 的 5 月月活用户突破 9 亿,较 2025 年同期的 4 亿翻了一倍以上,成为 Alphabet 增长最快的产品。9
6 月 6 日,谷歌为 Android Go(面向入门级设备的精简版 Android)推出 Gemini Go:只需 2GB 以上运行内存,即可在低配设备上体验生成式 AI 助手,全面取代原有 Google Assistant Go,支持拨打电话、发送短信、地图查询、上传文档和照片等日常任务。这意味着 AI 助手正向全球数十亿低端设备渗透。

Gemini 3.5 Flash:对 Google I/O 2026 提前释放信号

在本周期内,Google I/O 2026(5 月中旬落幕)的后续发酵也持续推进:Gemini 3.5 Flash 基准数据显示,在多步骤 Agent 任务(MCP Atlas)中得分 83.6%,超越前代 Gemini 3.1 Pro,每秒 Token 生成速度达到主流前沿模型的约 4 倍。谷歌透露 Gemini 3.5 Pro 预计将于 6 月正式推出。10

华为 HDC 2026:鸿蒙 7 正式进入「Agent OS」时代

6 月 12 日,华为开发者大会 2026(HDC 2026)在东莞松山湖开幕。余承东公布了鸿蒙生态的最新数据:HarmonyOS 6 终端设备突破 6600 万台,鸿蒙注册开发者超 1100 万,应用市场可获取应用超 40 万款。当天,HarmonyOS 7 Developer Beta 版正式发布11

Agent 亲和架构:操作系统的角色重新定义

华为将 HarmonyOS 7 的核心命题描述为:「从『原生 AI OS』推向『Agent OS』」。鸿蒙智能体框架 2.0(HMAF 2.0)是这次升级的底层骨架,AI 助手「小艺」与系统进一步融合,系统能力全面「Skill 化」——即把每一项系统功能封装为可供 AI 调用的标准化模块。
这套架构的逻辑是:不只让手机知道「装了哪些 App」,而是让系统理解「每个 App 能做什么、哪些能力可被调用、哪些任务可跨设备完成」。端侧部署了 30B 参数的本地大模型;云侧连接小艺开放平台和 Agent Core JiuWen 云侧模型。12

小艺的 Agent 基础已初具规模

余承东公布的小艺数据:日均唤醒 30 亿次,日活 1.8 亿,具备 2100+ 项系统能力、500+ 伙伴精选 Skill、2000+ 鸿蒙智能体。这一体量使鸿蒙的系统级 Agent 入口有了真实的流量基础,而不只是架构上的设想。
华为将 2026 年定义为鸿蒙继「2019 年发布 OS、2023 年启动原生应用」之后的第三个里程碑节点:「进入 Agent 时代」。

本周关键快讯

事件简述时间
Siri 历史背景苹果市场数据显示,Siri 全球月活占 AI 助手市场份额从 2023 年 28% 滑落至 2026 年约 22%,用户渗透率约 15.9% 3背景数据
苹果内部重组据彭博报道,2025 年初苹果曾召开秘密高层会议,时任 AI 负责人 John Giannandrea 随后被剥夺大部分职权;Vision Pro 核心推手 Mike Rockwell 接手 Siri,仍向软件工程 SVP Craig Federighi 汇报 26 月 8 日披露
小米端侧千亿突破小米 MiMo-V2 Pro 端侧模型总参数超过 1 万亿(激活参数 420 亿)正式上线,同月国内主流手机厂商集体突破端侧千亿参数关卡,搭载千亿端侧大模型手机出货量突破 2000 万台 42026 年 3 月(背景)
微软与 OpenAI 关系调整4 月 27 日,双方更新协议:OpenAI 对微软的 IP 授权不再排他,可向任意云平台提供产品;微软不再向 OpenAI 支付收入分成 64 月 27 日

本期结语:四家主要玩家的发布节奏高度集中,但技术路线已出现明显分岔:苹果选择「分发平台」、谷歌选择「垂直全栈」、微软转向「智能体生态」、华为走「Agent 亲和底层」——这四种路线会在端侧 AI 的真实用户留存率数据中得到检验。下期将跟进各平台开发者 Beta 版的初期反馈及 Gemini 3.5 Pro 的正式发布情况。

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。