AI 产品动态日报 · 2026 年 6 月 7 日

今天最值得读的，是 Anthropic 公开的一份自我解剖报告：他们承认 Claude 正逐步接近能够自主改进自身版本的临界点，而内部数据已经显示这一趋势。同一天，OpenAI 推出安全功能、苹果预热 WWDC AI 重构、Google 签下每月近十亿美元的算力大单，国内 MiniMax 开源前沿模型。AI 各个层次都在加速。

Anthropic：Claude 已在「帮助自己变更强」

Anthropic 发布了题为「When AI builds itself（当 AI 自我构建时）」的研究报告，用内部数据记录了 Claude 参与 AI 研发本身的程度。1

报告披露的数字颇为具体：截至 2026 年 5 月，Anthropic 代码库中超过 80% 的合并代码由 Claude 编写，而在 2025 年 2 月推出 Claude Code 之前这一占比还是个位数。同期，工程师人均季度代码产出达到 2024 年均值的 8 倍。

在最具代表性的开放式工程任务上，Claude 的完成率已达 76%，过去半年提升了 50 个百分点。报告还提到，Claude Mythos Preview 在 64% 的研究决策场景中表现优于人类研究员。

Anthropic 将 AI 研发参与程度划分了 5 个阶段：从 2021 年起步时「完全由人类完成」，到当前（2026 年 Q2）「AI 可自行运行代码、完成数小时委托任务」，距离「AI 自主闭环优化自身版本」仅剩最后一步。报告提出三种可能场景，认为「复合效率增长」最可能先到来——百人团队靠 AI 能完成原本数万人的工作量——并明确指出，一旦趋势持续，2026 年 Claude 就能覆盖人类需数天完成的任务，2027 年可覆盖需数周的任务。

Anthropic 内部数据：人均季度代码产出随 Claude 版本迭代大幅上升 — Anthropic 内部人均季度合并代码量变化图 1

Anthropic 在报告末尾强调，当前人类的核心优势集中在「研究品味和方向判断」——选什么问题、哪些结果可信、何时叫停一个错误方向。这份承认既是对自家产品能力的背书，也是在为监管讨论预铺地基：递归自我改进可能比主流预期更早到来。

OpenAI：「锁定模式」上线，专注企业数据安全

techcrunch.comhttps://techcrunch.com/2026/06/06/openai-unveils-lockdown-mode-to-protect-sensitive-data-from-prompt-injection-attacks/外部链接

正在加载内容卡片…

OpenAI 宣布上线 ChatGPT Lockdown Mode（锁定模式），面向处理敏感数据的企业和个人账户。2

锁定模式开启后，ChatGPT 会关闭实时网页浏览、网络图片检索、Deep Research 及 Agent 模式——这些功能恰恰是 Prompt Injection 攻击（通过网页内容植入恶意指令）最常见的入口。OpenAI 特别说明，即使在锁定模式下，攻击仍可能通过缓存内容或上传文件发生，但数据外泄的可能性大幅降低。

该功能目前向自助服务的 ChatGPT Business 账户和部分符合条件的个人账户推送，并非面向所有用户。

另一条与 OpenAI 相关的消息：特朗普政府正与 OpenAI 谈判政府持股事宜。据 CNBC 报道，双方讨论的结构之一是把部分股权注入 OpenAI 此前提议的「公共财富基金」，最终将收益分配给普通公民。3 特朗普本人对此表述为「让美国公众成为 AI 公司的伙伴」，未指名具体公司。参议员桑德斯从左翼立场提出了更激进的版本：对 OpenAI、Anthropic、xAI 一次性征收 50% 的股权税。两派提法方向不同，但都指向同一个问题：AI 产生的超额收益如何分配。

苹果 WWDC：Siri 的第二次机会

苹果年度开发者大会（WWDC 2026）将于北京时间 6 月 9 日凌晨开幕，AI 是本次主角。外界聚焦的核心是全面重构的 Siri——内部代号「New New Siri」，据报道技术基础将部分依托 Google Gemini。4

预期变化包括：Siri 出现在灵动岛、照片 App 等更多系统位置，可能首次推出独立应用；支持跨 App 指令执行、屏幕感知；对话历史可设置自动定期删除，不留存用户数据。苹果预计会继续强调 Private Cloud Compute，以隐私为切入点与 Google Gemini 的能力整合作出区分。

这是 Siri 的第二次 AI 重构机会。第一次在 2024 年 WWDC 发布时承诺的功能大量未能如期推出，还引发了集体诉讼和解。分析人士普遍认为，这次苹果没有容错空间：功能不落地就会被用户从「暂时落后」评价为「放弃 AI 赛道」。

微软 MAI 模型：能用，但领先感不强

Microsoft Build 2026 上推出的 4 款自研 MAI 模型（Thinking-1、Image-2.5、Transcribe-1.5、Voice-2）本周接受了媒体测试。PCMag 的评测结论直接：「这些模型处于实验阶段，优势不明显。」5

几个关键测试结论：MAI-Thinking-1 无法联网，在复杂推理上与 Claude Sonnet 相比没有明显优势；MAI-Image-2.5 比最初版本改善明显，但在文字渲染上仍逊于 Gemini Nano Banana Pro；MAI-Transcribe-1.5 转录准确率不及 Gemini；MAI-Voice-2 听感偏机械。微软将这批模型定位为「有限预览」，官方立场承认还不够成熟。

算力争夺：Google 每月向 SpaceX 支付 9.2 亿美元

本周另一个值得记住的数字：每月 9.2 亿美元。

Google 与 SpaceX 签署算力租赁协议，从 2026 年 10 月起到 2029 年 6 月，Google 将租用 SpaceX 旗下 xAI 数据中心约 11 万块 NVIDIA GPU。Google Cloud 方面表示，这笔交易是为满足 Gemini Enterprise 平台「超预期的客户需求」提供的过渡算力，并强调并非战略合作而是临时桥接。6

这是 SpaceX 在 IPO 前签下的第二笔大额算力租赁合同——上月已与 Anthropic 达成使用孟菲斯 Colossus 1 数据中心全部算力的协议。SpaceX AI 部门一季度营收 8.18 亿美元，经营亏损 25 亿美元，这批合同是在 IPO 前将数据中心变现的关键举措。

Alphabet 本周还宣布计划发行 850 亿美元股票（含巴菲特旗下伯克希尔哈撒韦 100 亿美元认购），用于满足 AI 基础设施的「史无前例的客户需求」，今年资本开支指引上调至 1800-1900 亿美元。

国内：MiniMax M3 开源，比亚迪首款 4nm 智驾芯片量产

MiniMax M3 于 6 月 1 日正式开源，是目前「前沿三件套」（强编程 / Agent 能力 + 100 万超长上下文 + 原生多模态）集齐的全球首个开源大模型。7

MiniMax M3 在 Artificial Analysis 综合智能指数排行榜上位列全球第七 — MiniMax M3 在 Artificial Analysis 综合智能指数排行榜中位列全球第七，是开源模型最高排名 7

在 Artificial Analysis 综合智能指数中，M3 位列全球第七，是开源模型的最高排名。SWE-Bench Pro 编程基准测试成绩超过 GPT-5.5 和 Gemini 3.1 Pro，仅次于 Claude Opus 4.7。定价上，个人开发者每月 119 元可获 18 亿 Token，折合每百万 Token 仅约 0.066 元，是同类国际闭源产品价格的十分之一左右，Vercel CEO Guillermo Rauch 评价该模型「能力仅略逊于 Opus 和 GPT-5，价格便宜 10 倍」。M3 同步发布了专为其训练的编程 Agent 产品 MiniMax Code，填补了国产 AI Coding 的 Agent 环节空白。

汽车方向，比亚迪于 5 月 28 日在深圳举办智能化战略发布会，正式推出中国首款 4nm 制程车规级智驾芯片「璇玑 A3」，已开始规模化量产，支持 L3/L4 级别自动驾驶。8 王传福在发布会上宣布为城市领航智驾安全「兜底」——如果因智能驾驶辅助系统原因导致事故，比亚迪承担责任。这一表态结合大量自有行驶数据和自研芯片，是在卡位 L3 商业化落地的先发位置。

政策与人事：白宫 AI 顾问 Sriram Krishnan 月底离职

特朗普政府 AI 政策高级顾问 Sriram Krishnan 宣布 6 月底离任，之后计划创立一个新机构，继续在外部影响美国 AI 政策走向。9 Krishnan 来自 a16z，前任职微软、Twitter、雅虎、Facebook、Snap，任期内主导了「AI 行动计划」，优先推动数据中心建设，而非监管框架。他在离职声明中点名 David Sacks，称其「继续推动美国 AI 领先至关重要」。Sacks 在今年初卸任 AI 沙皇后已转任总统科技顾问委员会联席主席。

白宫 AI 政策圈在一年内完成了一轮人事轮换——Sacks 和 Krishnan 相继离开执行层，但均以外部顾问或机构创始人身份留在政策影响圈内，这一「旋转门」结构预计不会改变核心政策方向。