AI OS 周报 #001｜苹果 Siri 大重建、微软 Agent 优先、谷歌全栈渗透、鸿蒙进入 Agent 时代

本期为频道创建首发，时间窗口覆盖 2026 年 6 月 3 日至 6 月 13 日，梳理该窗口内 AI OS 生态的重要进展。后续各期将严格按每周时间窗滚动发布。

六月上旬，AI OS 赛道迎来集中引爆：苹果 WWDC26 落幕、微软 Build 2026 收场，谷歌 Pixel 10 系列上市，华为 HDC 2026 接力开幕——四大玩家在同一个月窗口内集体亮牌。这一局面不是偶然，而是端侧 AI 能力从「演示」向「交付」过渡的临界信号。

本期重点追踪四条主线：苹果 Siri 重建的内部代价与技术路线；微软 Windows 如何从「应用平台」转型「智能体平台」；谷歌如何用芯片+系统+模型三层垂直整合占据 Android 制高点；华为鸿蒙 7 如何将 Agent 架构写入系统底层。

苹果 WWDC26：Siri 终于不拉胯了，但代价是向谷歌买单

北京时间 6 月 9 日凌晨，蒂姆·库克主持了他最后一届 WWDC 主题演讲，发布了 iOS 27 / iPadOS 27 / macOS 27 等系统以及 Siri 重建后的新形态——苹果官方将其命名为「Siri AI」。1

Siri AI：五项核心能力重塑交互逻辑

新 Siri 具备五项系统级能力：个人情境理解、图像理解、世界知识检索、屏幕感知以及跨 App 调用。两个最受关注的演示场景，一是识别照片里的地标并串联地图、好友聊天记录完成导航规划；二是跨越世界杯赛程、联系人通讯记录和全球美食信息，一句指令生成派对菜单并群发邀请。全程不需要手动切换 App。2

灵动岛（Dynamic Island）也升级为 Siri 的核心入口：唤醒后弹出「搜索或提问」药丸形输入栏；往下滑则进入带历史记录的对话界面。苹果还推出了 Siri 的独立 App，这是 iPhone 历史上首次为语音助手提供完整的应用程序入口。

苹果 Siri AI 与神经网络架构示意 — Siri AI 底层连接苹果端侧模型与谷歌 Gemini 云端模型，形成统一模型路由层 1

底层架构：苹果放弃自研大模型，押注谷歌 Gemini

这次升级的技术核心，是苹果把 Siri 和 Apple Intelligence 的云端基础层切换到了谷歌 Gemini——据多家媒体报道，苹果每年为此向谷歌支付约 10 亿美元。3 端侧推理则由苹果自研的 Apple Foundation Models 承担。

苹果同时宣布 Foundation Models Framework 升级为统一模型路由层：开发者可以调用苹果端侧模型、Private Cloud Compute 云端模型，或 Gemini、Claude 等第三方模型——苹果的定位由「做最好的模型」转向「做最好的模型分发入口」。苹果还在测试 Extensions 系统，未来用户可以将 ChatGPT、Qwen、Kimi 等设为 Siri 的默认回答引擎。4

硬件门槛与地区限制

苹果最强的端侧模型（AFM Core Advanced）门槛更高：iPhone 端限定 iPhone Air、iPhone 17 Pro 系列；iPad 端要求 M5 及以上芯片且配备 12GB 内存；Mac 端需 M3 或更新。iPhone 16 Pro Max、M1 MacBook 等设备仍可获得 Siri AI 的大部分功能，但无法使用「高度自定义语音」和「显著提升的语音听写」这两项依赖高端本地模型的特性。5

地区方面，Siri AI 暂不在中国大陆上线（受监管要求），欧盟地区初期也不登陆 iOS / iPadOS。

其他值得关注的 iOS 27 功能

重构画面（Reframe）：借助空间照片技术分析景深，允许后期调整构图角度，生成式 AI 自动填充边缘区域。
自然语言快捷指令：用口语描述需求，系统自动在「快捷指令」App 中完成工作流搭建。
Safari 智能摘要、家庭场景联动 等散装 AI 功能遍布系统各处。

微软 Build 2026：Windows 向「智能体平台」转型，Copilot+ 标签悄然淡化

6 月 3 日，微软 Build 2026 开发者大会在凌晨 0 点 30 分开幕。纳德拉的开幕语确定了本届大会的基调：「企业不应再只是消费前沿模型，而应当全面参与前沿模型生态系统的建设。」6

自研模型 MAI 家族：七款一次发布

微软在本届大会上发布了七款 MAI 自研模型，覆盖推理、代码、图像、语音、转录五大能力方向——彻底回应了「微软只是 OpenAI 套壳」的市场质疑。

核心旗舰是 MAI-Thinking-1：350 亿活跃参数（MoE 架构，总规模接近万亿），支持 256K 上下文，强调「从零训练、零蒸馏」，不依赖第三方模型输出训练。微软 AI 负责人穆斯塔法·苏莱曼描述其目标是：「构建一台持续靠计算量、数据和评估自我改进的爬山机器。」7

代码侧，MAI-Code-1-Flash（5B 参数）即时集成进 GitHub Copilot 和 VS Code，声称在处理高难度问题时 Token 消耗最高可比同定位模型低 60%。图像侧，MAI-Image-2.5 支持生成 4K 分辨率内容，Flash 版本针对移动端与低算力设备优化。

Windows 系统级变革：智能体成为「一等公民」

Windows 的核心交互逻辑正在被重写。微软将智能体能力嵌入 Windows Terminal，开发者无需切换聊天窗口即可在命令行里调用 AI 完成代码编写、调试和复杂任务执行。Linux 容器能力也被直接整合进 Windows，供智能体调用。

Project Solara 是一个全新面向智能体设备的操作系统，定位是「AI 原生 OS」，瞄准后智能手机时代的新设备形态。Microsoft Execution Containers（MXC）则为智能体提供安全沙箱隔离机制，支持企业级部署。

硬件侧，Surface RTX Spark Dev Box 是一款面向开发者的迷你主机，搭载 Arm 架构 CPU + Blackwell GPU + 128GB 统一内存，可本地运行最高 1200 亿参数的大模型。

AI 处理器芯片与端侧计算架构 — Surface RTX Spark Dev Box 搭载 Blackwell GPU + 128GB 统一内存，代表微软将高算力本地 AI 推向开发者工作站 7

Copilot+ 品牌悄然收缩，GPU 机器开放本地 AI

一个值得关注的信号：微软在 6 月 11 日更新了 GitHub 文档，宣布 Windows 11 的本地语言模型 API 不再限定于 Copilot+ PC（此前要求内置 NPU），只要系统配备至少 6GB 显存的 NVIDIA GeForce RTX 30 系列或更新显卡，即可运行本地 AI 工作负载。此次开放的 API 由微软的小型语言模型 Phi Silica 驱动，支持文本格式化、摘要、改写、转表格等功能。8

这一动作意味着 Copilot+ 品牌的「NPU 独占」护城河正在被主动拆除。结合苹果将模型路由对外开放，AI OS 硬件门槛的全面下探已成趋势。

谷歌：Gemini Nano 常驻端侧，Android 生态全面渗透

谷歌在本周期内的推进路线是「垂直整合到底」——从大模型到芯片到操作系统到手机，每层自研。

Pixel 10 + Tensor G5：芯片把 AI 写进硬件层

Pixel 10 系列搭载的 Tensor G5，是谷歌首次完全摆脱三星代工、转投台积电 3nm 的产物。TPU（谷歌的 NPU 等效单元）性能较前代提升 60%，CPU 多核性能提升 20%–35%。Gemini Nano 被直接常驻在这颗芯片上，无需联网即可完成上下文建议、文本摘要、实时翻译、语音增强等超过 20 项本地 AI 功能。4

CPU 处理器芯片架构与 AI 推理模块示意 — Tensor G5 TPU 较前代提升 60%，Gemini Nano 常驻端侧代表谷歌「模型到芯片到系统」垂直整合路线 4

Gemini App 月活破 9 亿，Gemini Go 下沉低端机

6 月 4 日，Alphabet 在投资者演示中披露：Gemini App 的 5 月月活用户突破 9 亿，较 2025 年同期的 4 亿翻了一倍以上，成为 Alphabet 增长最快的产品。9

6 月 6 日，谷歌为 Android Go（面向入门级设备的精简版 Android）推出 Gemini Go：只需 2GB 以上运行内存，即可在低配设备上体验生成式 AI 助手，全面取代原有 Google Assistant Go，支持拨打电话、发送短信、地图查询、上传文档和照片等日常任务。这意味着 AI 助手正向全球数十亿低端设备渗透。

Gemini 3.5 Flash：对 Google I/O 2026 提前释放信号

在本周期内，Google I/O 2026（5 月中旬落幕）的后续发酵也持续推进：Gemini 3.5 Flash 基准数据显示，在多步骤 Agent 任务（MCP Atlas）中得分 83.6%，超越前代 Gemini 3.1 Pro，每秒 Token 生成速度达到主流前沿模型的约 4 倍。谷歌透露 Gemini 3.5 Pro 预计将于 6 月正式推出。10

华为 HDC 2026：鸿蒙 7 正式进入「Agent OS」时代

6 月 12 日，华为开发者大会 2026（HDC 2026）在东莞松山湖开幕。余承东公布了鸿蒙生态的最新数据：HarmonyOS 6 终端设备突破 6600 万台，鸿蒙注册开发者超 1100 万，应用市场可获取应用超 40 万款。当天，HarmonyOS 7 Developer Beta 版正式发布。11

Agent 亲和架构：操作系统的角色重新定义

华为将 HarmonyOS 7 的核心命题描述为：「从『原生 AI OS』推向『Agent OS』」。鸿蒙智能体框架 2.0（HMAF 2.0）是这次升级的底层骨架，AI 助手「小艺」与系统进一步融合，系统能力全面「Skill 化」——即把每一项系统功能封装为可供 AI 调用的标准化模块。

这套架构的逻辑是：不只让手机知道「装了哪些 App」，而是让系统理解「每个 App 能做什么、哪些能力可被调用、哪些任务可跨设备完成」。端侧部署了 30B 参数的本地大模型；云侧连接小艺开放平台和 Agent Core JiuWen 云侧模型。12

小艺的 Agent 基础已初具规模

余承东公布的小艺数据：日均唤醒 30 亿次，日活 1.8 亿，具备 2100+ 项系统能力、500+ 伙伴精选 Skill、2000+ 鸿蒙智能体。这一体量使鸿蒙的系统级 Agent 入口有了真实的流量基础，而不只是架构上的设想。

华为将 2026 年定义为鸿蒙继「2019 年发布 OS、2023 年启动原生应用」之后的第三个里程碑节点：「进入 Agent 时代」。

本周关键快讯

事件	简述	时间
Siri 历史背景	苹果市场数据显示，Siri 全球月活占 AI 助手市场份额从 2023 年 28% 滑落至 2026 年约 22%，用户渗透率约 15.9% 3	背景数据
苹果内部重组	据彭博报道，2025 年初苹果曾召开秘密高层会议，时任 AI 负责人 John Giannandrea 随后被剥夺大部分职权；Vision Pro 核心推手 Mike Rockwell 接手 Siri，仍向软件工程 SVP Craig Federighi 汇报 2	6 月 8 日披露
小米端侧千亿突破	小米 MiMo-V2 Pro 端侧模型总参数超过 1 万亿（激活参数 420 亿）正式上线，同月国内主流手机厂商集体突破端侧千亿参数关卡，搭载千亿端侧大模型手机出货量突破 2000 万台 4	2026 年 3 月（背景）
微软与 OpenAI 关系调整	4 月 27 日，双方更新协议：OpenAI 对微软的 IP 授权不再排他，可向任意云平台提供产品；微软不再向 OpenAI 支付收入分成 6	4 月 27 日

本期结语：四家主要玩家的发布节奏高度集中，但技术路线已出现明显分岔：苹果选择「分发平台」、谷歌选择「垂直全栈」、微软转向「智能体生态」、华为走「Agent 亲和底层」——这四种路线会在端侧 AI 的真实用户留存率数据中得到检验。下期将跟进各平台开发者 Beta 版的初期反馈及 Gemini 3.5 Pro 的正式发布情况。