
25/6/2026 · 8:11
OpenAI上芯片,CUDA也被围了
过去24小时,AI主线从模型发布转向「控栈」:OpenAI/Broadcom拿出Jalapeño,Qualcomm收购Modular冲击CUDA式软件层,Anthropic把Claude塞进Slack又指控阿里蒸馏,Mistral和Figma则继续推进文档与设计工作流。
AI 日报今天的关键词:控栈。
不是谁又把模型榜单刷高几分,而是谁能把推理成本、企业入口、跨芯片软件层和模型边界攥在手里。
过去 24 小时,几条线同时撞上来:OpenAI 把自研推理芯片 Jalapeño 亮出来;Qualcomm 用近 40 亿美元全股票收购 Modular,冲着 NVIDIA CUDA 的开发者粘性去;Anthropic 一边把 Claude 塞进 Slack 当团队成员,一边向美国参议员称阿里发起了其迄今最大蒸馏攻击;Mistral 发布 OCR 4,Figma 则把代码、动画、shader 和 AI 代理搬进设计画布。
一句话:AI 公司不只卷模型了,开始卷模型背后的整条生产线。
一屏速览
推理芯片:OpenAI 和 Broadcom 发布 Jalapeño,定位为 LLM 推理芯片,计划 2026 年底开始部署。1 这说明 OpenAI 要把成本、延迟和供给从 GPU 租赁里往外拽。
跨芯片软件层:Qualcomm 宣布以近 40 亿美元全股票收购 Modular,目标是补上跨芯片 AI 软件层。2 这笔交易盯上的不是模型,而是 CUDA 式开发者入口。
企业 Agent 入口:Claude Tag 进入 Slack beta,面向 Claude Enterprise 和 Team 客户。3 企业 AI 从聊天框变成群聊里的「同事」。
模型边界:Anthropic 称阿里相关操作者通过近 2.5 万个欺诈账号发起蒸馏攻击;阿里未立即回应 Reuters。4 模型能力开始像代码、芯片、专利一样被防守。
文档 AI:Mistral OCR 4 支持 170 种语言,给出边界框、区块类型和置信度。5 RAG 和企业搜索的脏活,继续被模型吃掉。
设计工作流:Figma 新增 Code Layers、动画、3D、shader 和 AI 插件能力。6 设计工具不想被「一句话生成界面」绕开。
OpenAI 上芯片,算力账单要自己管
OpenAI 这次拿出来的 Jalapeño,是它和 Broadcom 共同开发的第一代「Intelligence Processor」。官方说法很直接:这不是通用加速器改一改,而是从 LLM 推理需求出发设计的芯片,目标是让 ChatGPT、Codex、API 和未来 Agent 产品跑得更快、更稳、更便宜。1
几个数字值得抓住:Jalapeño 从设计到 tape-out 用了 9 个月;工程样片已经在实验室以目标频率和功耗跑 ML 工作负载,包括 GPT-5.3-Codex-Spark;OpenAI 称早期测试显示其每瓦性能「显著优于」当前最先进水平,但完整技术报告还要等后续公布。1
Reuters 补了更硬的供应链细节:Broadcom CEO Hock Tan 称,这颗芯片可以和 NVIDIA Blackwell 或 Google TPU 相提并论;Celestica 将负责服务器系统;OpenAI 计划年底部署,芯片只供 OpenAI 使用。7
这条新闻的重点不在「OpenAI 也造芯片」这个标题党,而在推理成本已经压到商业模型的脖子上。训练是大额资本开支,推理才是每天都在烧的电表。OpenAI 如果只靠外部 GPU 供给,产品越成功,账单越难看。自研推理芯片至少给了它一个谈判筹码。
Qualcomm 买 Modular,CUDA 被盯上了
另一边,Qualcomm 也出手了。Reuters 报道,Qualcomm 将以全股票交易收购 AI 软件创业公司 Modular,交易估值接近 40 亿美元;这家公司做的是让 AI 模型跨芯片运行的软件层,尽量避免开发者为每种处理器单独写代码。2
这就很明确了:Qualcomm 要冲的不是又一个模型,而是 NVIDIA 最难啃的部分,CUDA 生态。Reuters 也把逻辑点透了,Modular 主要用于 AI 推理,定位为支持 NVIDIA、AMD 和其他供应商芯片的中立软件层;交易预计今年下半年完成。2

这笔收购如果成了,信号比金额更大。过去两年,很多公司都说要做 AI 芯片;但芯片能不能卖出去,往往卡在软件栈。开发者不想为了省一点成本,就重写一堆推理部署代码。Modular 的价值就在这里:帮 Qualcomm 把「我们也有芯片」翻译成「你真的能迁过来」。
Claude 进 Slack,企业 AI 开始认频道了
Anthropic 这边,产品线也往企业工作流里钻。
Claude Tag 的用法很像把 Claude 变成 Slack 频道里的团队成员:管理员给它授权工具、数据和代码库,频道里的人直接@Claude 布置任务,它会拆步骤、调用可用工具,在 thread 里回报结果。Anthropic 称,Claude Tag 现在面向 Claude Enterprise 和 Team 客户 beta 开放。3
更刺激的是内部数字。Anthropic 说,公司产品团队 65%的代码已经由内部版 Claude Tag 创建;工程之外的团队也用它追踪产品指标、处理支持工单、排查 bug。3

它和普通聊天机器人最大的差别,是「频道身份」。每个频道可以有一个不同的 Claude,记忆和权限被限定在对应频道里;销售频道的 Claude 不会把记忆传给工程频道。管理员还能设置 token 支出上限,并查看每次动作是谁触发的。3
企业 AI 的形态正在变。第一阶段是员工自己打开一个聊天框;第二阶段是 AI 进到具体流程里;现在这步更像「进组织结构」。谁能在 Slack、GitHub、Figma、Notion 这些日常工作空间里拿到长期上下文,谁就更接近企业知识的入口。
Anthropic 指控阿里蒸馏,模型能力也要设防
同一天,Anthropic 还有一条更硬的新闻。
Reuters 报道称,Anthropic 在一封信中指控阿里巴巴及其 Qwen 实验室相关操作者非法提取 Claude 模型能力,称这是 Anthropic 迄今所知规模最大的蒸馏攻击。Anthropic 称,这场活动发生在 2026 年 4 月 22 日至 6 月 5 日之间,通过近 2.5 万个欺诈账号与 Claude 产生超过 2880 万次交互;阿里未立即回应 Reuters 置评请求。4
这事要分开看。事实层面,目前这是 Anthropic 的指控,Reuters 看到的是一封写给美国参议院银行委员会主席 Tim Scott 和资深成员 Elizabeth Warren 的信,信件日期为 6 月 10 日。4
但趋势层面,AI 公司已经把模型输出看成需要保护的资产。以前防的是模型权重泄漏,现在还要防「用你的答案训练我的模型」。如果蒸馏争议继续升级,大模型 API 的风控、访问门槛、企业审计都会变重。对开发者来说,调用模型可能会越来越像调用金融服务:额度、身份、异常行为检测,一个都少不了。
Mistral OCR 4 上线,文档脏活又少一块
模型发布这边,Mistral 把 OCR 4 推了出来。它不只是把 PDF、Word、PPT 里的字抠出来,还会返回边界框、区块分类和行内置信度,能识别标题、表格、公式、签名等元素。Mistral 称,OCR 4 支持 170 种语言,适合企业搜索、RAG 和领域检索管线。5
官方给的评测也比较具体:Mistral 用 600 多份、12 种以上语言的真实文档做盲测,独立标注者平均 72%的情况下更偏好 OCR 4 输出;它还在 OlmOCRBench 上拿到 85.20 的总体分数,在内部 Crawl Multilingual 评测中为 0.98。Mistral 同时提醒,自动 benchmark 存在标注和评分噪声,真实使用仍建议拿自己的文档测。5

价格也出来了:API 为每 1000 页 4 美元,Batch API 折半到 2 美元,Document AI 是每 1000 页 5 美元;对数据驻留和合规要求高的企业,还可以选择自托管。5
这类发布不一定有 OpenAI 芯片那么炸,但很实用。企业 AI 落地最烦的部分,经常不是模型不会回答,而是文档进不来、结构乱、表格和签名识别不稳。OCR 4 这类工具把「喂给模型之前的脏活」继续压缩,RAG 项目的失败点也会随之往后移。
Figma 把代码搬上画布,设计工具开始反击 Agent
Figma 在 Config 2026 上的更新,核心是把设计画布继续扩成产品协作空间。TechCrunch 报道,Figma 新增 Code Layers,支持把代码直接放进协作画布;同时加入动画、转场、3D transform、shader 效果,以及用 AI 创建自定义插件的能力。6

The Decoder 的观察更尖一点:Figma 的 AI 能力依赖 OpenAI、Anthropic 和 Google 等外部模型,推理成本直接压利润率;Figma 2025 年的毛利率从约 92%降到 86%,下降与大规模 AI 推理成本相关。与此同时,Anthropic 自己的 Claude Design 也在生成原型和营销资产,供应商正在变成竞争对手。8
这就是 Figma 的尴尬:不用 AI,会被新工具绕开;用 AI,账单和竞争关系都变复杂。它这次把 Code Layers、Motion、Shaders 和 Weave 工作流搬进画布,本质上是在说:你可以用 AI 生成,但别离开 Figma 生成。
Google 人才继续外流,顶级研究员也在重新站队
最后补一条公司动态。
TechCrunch 援引 Bloomberg 报道称,Google 顶级 AI 研究员 Jonas Adler 和 Alexander Pritzel 将离开 Google 加入 Anthropic,两人曾在 Gemini 开发中扮演关键角色。文章还把这事放进更大的离职链条里:Noam Shazeer 上周宣布离开 Google 去 OpenAI;DeepMind 主管 John Jumper 也已表示将去 Anthropic。9
人才流动单看一两个人,容易被写成八卦。但连续发生时,它就会变成行业信号。OpenAI 和 Anthropic 准备上市、给股权预期;Google 有模型、算力和分发,却要继续证明它能留住最核心的人。AI 竞赛卷到后半段,模型、芯片、数据中心之外,最贵的还是能把这些东西串起来的人。
今天的判断
今天这组新闻放在一起,主线很清楚:AI 的战场从「模型能力」往「控制权」迁移。
OpenAI 和 Qualcomm 在争推理成本与软件栈;Anthropic 在争企业入口和模型边界;Mistral 在争企业文档入口;Figma 在守住 AI 生成界面之前的协作阵地;Google 则面临人才被对手挖走的压力。
下一步要看的不是哪家又发了一个更会聊天的模型,而是谁能同时控制三件事:算力怎么来,模型怎么进工作流,输出能力怎么不被别人拿走。控制住这三件事,AI 公司才真正有资格说自己不只是一个 API 供应商。
Fuentes de referencia
- 1OpenAI - OpenAI and Broadcom unveil LLM-optimized inference chip
- 2Reuters - Qualcomm to buy startup Modular for 4 billion in AI software push
- 3Anthropic - Introducing Claude Tag
- 4Reuters - Anthropic says Alibaba illicitly extracted Claude AI model capabilities
- 5Mistral AI - Mistral OCR 4
- 6TechCrunch - Figma adds code layers support for animations more AI features
- 7Reuters - OpenAI unveils custom chip it designed with Broadcom
- 8The Decoder - Figma bets on human judgment at Config 2026
- 9TechCrunch - AI researchers continue to leave Google for its rivals



Añade más opiniones o contexto en torno a este contenido.