AI 圈要闻速递｜苹果 Siri 独立 App 曝光、Groq 拟融资 6.5 亿美元、Mistral 投 47 亿建数据中心

一、苹果 iOS 27 泄露：Siri 将有独立 App，底层接 Gemini

Bloomberg 在 WWDC 前夕曝光苹果 iOS 27 的 Siri 改版设计：Siri 将从系统级语音助手升级为拥有独立应用的 AI 对话产品，直接对标 ChatGPT、Claude 和 Gemini。

独立 Siri App 支持上传文档和图片，保留历史对话，交互方式和现有 AI 聊天产品基本一致。在系统层，Siri 入口整合进动态灵动岛——快速语音问题从顶部弹出回应，向下滑动可触发 AI 搜索界面，结果以卡片形式呈现。底层使用 Google Gemini 技术提供增强智能，与苹果今年 1 月确认的 Gemini 合作一致。

苹果的优势在于 25 亿台设备的安装基数，而 ChatGPT 目前有 9 亿周活跃用户——这个差距决定了苹果有机会把大量从未使用过 AI 助手的用户直接带入这个生态。

二、Groq 拟融资 6.5 亿美元，Nvidia「不收购」协议后转做推理云

Groq 正在向现有投资方寻求 6.5 亿美元新一轮融资，资金将用于扩张其推理云业务。

背景是去年 12 月 Groq 与 Nvidia 签订了一份「非收购」协议——标价约 200 亿美元，部分高管转到 Nvidia，Groq 的硬件技术授权给 Nvidia——投资方随之获得现金兑付。现在 Groq 希望这些股东继续跟投，支持公司从芯片硬件转向推理云方向。

据 Axios 报道，即使现有投资方中有人不愿追投，现有股东 Disruptive 和 Infinitium 已承诺兜底填满本轮。公司当前由临时 CEO Adam Winter 和 CFO Matt Eng 领导。

推理云的市场逻辑是：模型训练的需求已基本饱和，当前企业更急需的是低成本、高吞吐的推理服务，这也是 Groq 自研芯片的核心卖点。

三、Glean ARR 突破 3 亿美元，「帮企业省 AI 账单」成主要卖点

企业 AI 搜索公司 Glean 宣布年度经常性收入（ARR）突破 3 亿美元，距离上次宣布 1 亿美元仅过了 15 个月。公司上一轮 F 轮融资（1.5 亿美元）完成时估值 72 亿美元。

Glean 定位是连接企业内部各系统（Google Workspace、Slack、Databricks 等）的 AI 搜索层，CEO Arvind Jain 把这个架构称为「上下文图谱」（context graph）。他的卖点变了：在 AI 预算普遍膨胀的背景下，Glean 声称能减少模型推理次数，让企业 AI 消耗更少的 token，从而降低 AI 账单。

Glean 的客户包括 Databricks、Reddit、Pinterest 和三星。竞争对手则是微软、谷歌、OpenAI、Anthropic、Salesforce 等几乎所有大厂。

需要说明的是，Glean 的 3 亿美元数字包含消耗制收入（非固定订阅），与传统 ARR 定义有出入。

四、Mistral 发布 Vibe AI Agent，宣布投 46.6 亿美元建数据中心

在巴黎 AI Now 峰会上，法国 AI 公司 Mistral 同步公布了多项动作：将旗下消费者产品 Le Chat 重构为「Vibe」，定位统一的生产力与编程 AI Agent；同时披露了 Mistral Compute 计划——总投资 40 亿欧元（约 46.6 亿美元）在法国和瑞典建设自营数据中心，目标是 2027 年达到 200MW，2030 年达到 1GW。

Vibe 分两个模式：Work Mode 支持接入 Google Workspace、Slack、GitHub 等工具完成多步骤任务；Code Mode 则面向开发者，可对接 GitHub 仓库、自动提交 Pull Request。基础版免费，专业版每月 14.99 美元。

工业 AI 方向上，Mistral 收购了 Emmi AI 获取物理仿真能力，与空客、宝马和 ASML 合作落地工程场景——ASML 的应用案例显示推理速度提升 120 倍。

公司目前有 1000 名员工，目标 2026 年实现 10 亿欧元（约 11.7 亿美元）营收。

4 5

五、韩国芯片初创 XCENA 完成 1.35 亿美元 B 轮，押注 AI 内存瓶颈

韩国芯片创业公司 XCENA 完成 1.35 亿美元 B 轮融资，估值 5.7 亿美元，累计融资达 1.85 亿美元。B 轮由韩国风投 Atinum 和 IMM Investment 领投。

XCENA 的论点是：限制 AI 推理速度的不是算力，而是内存带宽。其自研芯片 MX1 基于 RISC-V 架构，通过 CXL 接口将计算单元部署在紧邻 DRAM 的位置，直接在内存模块内完成 KV 缓存管理和数据预处理，减少 CPU、GPU 与内存之间的数据往返。

这个技术路线与英伟达 GPU 中心化算力模型形成直接对比，也让 XCENA 与 Groq 的推理优化逻辑形成呼应——两家公司都在押注：下一轮 AI 基础设施竞争不在 FLOPS，而在数据搬运效率。

信源：TechCrunch、VentureBeat、Mistral 官方公告 · 整理自 2026-05-29 至 2026-05-30