OpenAI上芯片，CUDA也被围了 (2026)

AI 日报今天的关键词：控栈。

不是谁又把模型榜单刷高几分，而是谁能把推理成本、企业入口、跨芯片软件层和模型边界攥在手里。

过去 24 小时，几条线同时撞上来：OpenAI 把自研推理芯片 Jalapeño 亮出来；Qualcomm 用近 40 亿美元全股票收购 Modular，冲着 NVIDIA CUDA 的开发者粘性去；Anthropic 一边把 Claude 塞进 Slack 当团队成员，一边向美国参议员称阿里发起了其迄今最大蒸馏攻击；Mistral 发布 OCR 4，Figma 则把代码、动画、shader 和 AI 代理搬进设计画布。

一句话：AI 公司不只卷模型了，开始卷模型背后的整条生产线。

一屏速览

推理芯片：OpenAI 和 Broadcom 发布 Jalapeño，定位为 LLM 推理芯片，计划 2026 年底开始部署。1 这说明 OpenAI 要把成本、延迟和供给从 GPU 租赁里往外拽。

跨芯片软件层：Qualcomm 宣布以近 40 亿美元全股票收购 Modular，目标是补上跨芯片 AI 软件层。2 这笔交易盯上的不是模型，而是 CUDA 式开发者入口。

企业 Agent 入口：Claude Tag 进入 Slack beta，面向 Claude Enterprise 和 Team 客户。3 企业 AI 从聊天框变成群聊里的「同事」。

模型边界：Anthropic 称阿里相关操作者通过近 2.5 万个欺诈账号发起蒸馏攻击；阿里未立即回应 Reuters。4 模型能力开始像代码、芯片、专利一样被防守。

文档 AI：Mistral OCR 4 支持 170 种语言，给出边界框、区块类型和置信度。5 RAG 和企业搜索的脏活，继续被模型吃掉。

设计工作流：Figma 新增 Code Layers、动画、3D、shader 和 AI 插件能力。6 设计工具不想被「一句话生成界面」绕开。

OpenAI 上芯片，算力账单要自己管

OpenAI 这次拿出来的 Jalapeño，是它和 Broadcom 共同开发的第一代「Intelligence Processor」。官方说法很直接：这不是通用加速器改一改，而是从 LLM 推理需求出发设计的芯片，目标是让 ChatGPT、Codex、API 和未来 Agent 产品跑得更快、更稳、更便宜。1

几个数字值得抓住：Jalapeño 从设计到 tape-out 用了 9 个月；工程样片已经在实验室以目标频率和功耗跑 ML 工作负载，包括 GPT-5.3-Codex-Spark；OpenAI 称早期测试显示其每瓦性能「显著优于」当前最先进水平，但完整技术报告还要等后续公布。1

Reuters 补了更硬的供应链细节：Broadcom CEO Hock Tan 称，这颗芯片可以和 NVIDIA Blackwell 或 Google TPU 相提并论；Celestica 将负责服务器系统；OpenAI 计划年底部署，芯片只供 OpenAI 使用。7

这条新闻的重点不在「OpenAI 也造芯片」这个标题党，而在推理成本已经压到商业模型的脖子上。训练是大额资本开支，推理才是每天都在烧的电表。OpenAI 如果只靠外部 GPU 供给，产品越成功，账单越难看。自研推理芯片至少给了它一个谈判筹码。

Qualcomm 买 Modular，CUDA 被盯上了

另一边，Qualcomm 也出手了。Reuters 报道，Qualcomm 将以全股票交易收购 AI 软件创业公司 Modular，交易估值接近 40 亿美元；这家公司做的是让 AI 模型跨芯片运行的软件层，尽量避免开发者为每种处理器单独写代码。2

这就很明确了：Qualcomm 要冲的不是又一个模型，而是 NVIDIA 最难啃的部分，CUDA 生态。Reuters 也把逻辑点透了，Modular 主要用于 AI 推理，定位为支持 NVIDIA、AMD 和其他供应商芯片的中立软件层；交易预计今年下半年完成。2

Qualcomm 在印度 AI Impact Summit 展台 — Qualcomm 在 2026 年 2 月印度 AI Impact Summit 的展台。收购 Modular 后，它要补的是数据中心 AI 软件层。2

这笔收购如果成了，信号比金额更大。过去两年，很多公司都说要做 AI 芯片；但芯片能不能卖出去，往往卡在软件栈。开发者不想为了省一点成本，就重写一堆推理部署代码。Modular 的价值就在这里：帮 Qualcomm 把「我们也有芯片」翻译成「你真的能迁过来」。

Claude 进 Slack，企业 AI 开始认频道了

Anthropic 这边，产品线也往企业工作流里钻。

Claude Tag 的用法很像把 Claude 变成 Slack 频道里的团队成员：管理员给它授权工具、数据和代码库，频道里的人直接@Claude 布置任务，它会拆步骤、调用可用工具，在 thread 里回报结果。Anthropic 称，Claude Tag 现在面向 Claude Enterprise 和 Team 客户 beta 开放。3

更刺激的是内部数字。Anthropic 说，公司产品团队 65%的代码已经由内部版 Claude Tag 创建；工程之外的团队也用它追踪产品指标、处理支持工单、排查 bug。3

Claude Tag 官方示意图 — Claude Tag 从个人聊天框进入 Slack 频道，关键差别是上下文、权限和可审计日志都跟团队绑定。3

它和普通聊天机器人最大的差别，是「频道身份」。每个频道可以有一个不同的 Claude，记忆和权限被限定在对应频道里；销售频道的 Claude 不会把记忆传给工程频道。管理员还能设置 token 支出上限，并查看每次动作是谁触发的。3

企业 AI 的形态正在变。第一阶段是员工自己打开一个聊天框；第二阶段是 AI 进到具体流程里；现在这步更像「进组织结构」。谁能在 Slack、GitHub、Figma、Notion 这些日常工作空间里拿到长期上下文，谁就更接近企业知识的入口。

Anthropic 指控阿里蒸馏，模型能力也要设防

同一天，Anthropic 还有一条更硬的新闻。

Reuters 报道称，Anthropic 在一封信中指控阿里巴巴及其 Qwen 实验室相关操作者非法提取 Claude 模型能力，称这是 Anthropic 迄今所知规模最大的蒸馏攻击。Anthropic 称，这场活动发生在 2026 年 4 月 22 日至 6 月 5 日之间，通过近 2.5 万个欺诈账号与 Claude 产生超过 2880 万次交互；阿里未立即回应 Reuters 置评请求。4

这事要分开看。事实层面，目前这是 Anthropic 的指控，Reuters 看到的是一封写给美国参议院银行委员会主席 Tim Scott 和资深成员 Elizabeth Warren 的信，信件日期为 6 月 10 日。4

但趋势层面，AI 公司已经把模型输出看成需要保护的资产。以前防的是模型权重泄漏，现在还要防「用你的答案训练我的模型」。如果蒸馏争议继续升级，大模型 API 的风控、访问门槛、企业审计都会变重。对开发者来说，调用模型可能会越来越像调用金融服务：额度、身份、异常行为检测，一个都少不了。

Mistral OCR 4 上线，文档脏活又少一块

模型发布这边，Mistral 把 OCR 4 推了出来。它不只是把 PDF、Word、PPT 里的字抠出来，还会返回边界框、区块分类和行内置信度，能识别标题、表格、公式、签名等元素。Mistral 称，OCR 4 支持 170 种语言，适合企业搜索、RAG 和领域检索管线。5

官方给的评测也比较具体：Mistral 用 600 多份、12 种以上语言的真实文档做盲测，独立标注者平均 72%的情况下更偏好 OCR 4 输出；它还在 OlmOCRBench 上拿到 85.20 的总体分数，在内部 Crawl Multilingual 评测中为 0.98。Mistral 同时提醒，自动 benchmark 存在标注和评分噪声，真实使用仍建议拿自己的文档测。5

Mistral OCR 4 性能对比图 — Mistral 官方给出的 OCR 模型对比图，OCR 4 在 OlmOCRBench 和 Crawl Multilingual 两个评测上领先。5

价格也出来了：API 为每 1000 页 4 美元，Batch API 折半到 2 美元，Document AI 是每 1000 页 5 美元；对数据驻留和合规要求高的企业，还可以选择自托管。5

这类发布不一定有 OpenAI 芯片那么炸，但很实用。企业 AI 落地最烦的部分，经常不是模型不会回答，而是文档进不来、结构乱、表格和签名识别不稳。OCR 4 这类工具把「喂给模型之前的脏活」继续压缩，RAG 项目的失败点也会随之往后移。

Figma 把代码搬上画布，设计工具开始反击 Agent

Figma 在 Config 2026 上的更新，核心是把设计画布继续扩成产品协作空间。TechCrunch 报道，Figma 新增 Code Layers，支持把代码直接放进协作画布；同时加入动画、转场、3D transform、shader 效果，以及用 AI 创建自定义插件的能力。6

Figma Code Layers 界面 — Figma Code Layers 把代码和设计层放在同一画布，方便设计师、工程师和产品经理一起迭代。6

The Decoder 的观察更尖一点：Figma 的 AI 能力依赖 OpenAI、Anthropic 和 Google 等外部模型，推理成本直接压利润率；Figma 2025 年的毛利率从约 92%降到 86%，下降与大规模 AI 推理成本相关。与此同时，Anthropic 自己的 Claude Design 也在生成原型和营销资产，供应商正在变成竞争对手。8

这就是 Figma 的尴尬：不用 AI，会被新工具绕开；用 AI，账单和竞争关系都变复杂。它这次把 Code Layers、Motion、Shaders 和 Weave 工作流搬进画布，本质上是在说：你可以用 AI 生成，但别离开 Figma 生成。

Google 人才继续外流，顶级研究员也在重新站队

最后补一条公司动态。

TechCrunch 援引 Bloomberg 报道称，Google 顶级 AI 研究员 Jonas Adler 和 Alexander Pritzel 将离开 Google 加入 Anthropic，两人曾在 Gemini 开发中扮演关键角色。文章还把这事放进更大的离职链条里：Noam Shazeer 上周宣布离开 Google 去 OpenAI；DeepMind 主管 John Jumper 也已表示将去 Anthropic。9

人才流动单看一两个人，容易被写成八卦。但连续发生时，它就会变成行业信号。OpenAI 和 Anthropic 准备上市、给股权预期；Google 有模型、算力和分发，却要继续证明它能留住最核心的人。AI 竞赛卷到后半段，模型、芯片、数据中心之外，最贵的还是能把这些东西串起来的人。

今天的判断

今天这组新闻放在一起，主线很清楚：AI 的战场从「模型能力」往「控制权」迁移。

OpenAI 和 Qualcomm 在争推理成本与软件栈；Anthropic 在争企业入口和模型边界；Mistral 在争企业文档入口；Figma 在守住 AI 生成界面之前的协作阵地；Google 则面临人才被对手挖走的压力。

下一步要看的不是哪家又发了一个更会聊天的模型，而是谁能同时控制三件事：算力怎么来，模型怎么进工作流，输出能力怎么不被别人拿走。控制住这三件事，AI 公司才真正有资格说自己不只是一个 API 供应商。

OpenAI上芯片，CUDA也被围了

一屏速览

OpenAI 上芯片，算力账单要自己管

Qualcomm 买 Modular，CUDA 被盯上了

Claude 进 Slack，企业 AI 开始认频道了

Anthropic 指控阿里蒸馏，模型能力也要设防

Mistral OCR 4 上线，文档脏活又少一块

Figma 把代码搬上画布，设计工具开始反击 Agent

Google 人才继续外流，顶级研究员也在重新站队

今天的判断

Fuentes de referencia

Contenido relacionado

AI 全景情报 0625：OpenAI 造芯、Qualcomm 买软件，AI 基建开始自己长骨头

OpenAI下场造芯：Jalapeño

四连翻车：芯片上桌，吐司验机