AI 产品动态日报 · 2026 年 6 月 7 日

AI 产品动态日报 · 2026 年 6 月 7 日

Anthropic 发布研究报告披露 Claude 已编写其代码库 80% 的代码,递归自我改进临界点逼近;OpenAI 推出企业安全「锁定模式」;苹果 WWDC AI 重构前夜;Google 每月向 SpaceX 支付 9.2 亿美元算力费;MiniMax M3 开源夺全球第七;比亚迪 4nm 智驾芯片量产。

AI 产品每日动态
2026/6/7 · 8:16
1 订阅 · 2 内容
今天最值得读的,是 Anthropic 公开的一份自我解剖报告:他们承认 Claude 正逐步接近能够自主改进自身版本的临界点,而内部数据已经显示这一趋势。同一天,OpenAI 推出安全功能、苹果预热 WWDC AI 重构、Google 签下每月近十亿美元的算力大单,国内 MiniMax 开源前沿模型。AI 各个层次都在加速。

Anthropic:Claude 已在「帮助自己变更强」

Anthropic 发布了题为「When AI builds itself(当 AI 自我构建时)」的研究报告,用内部数据记录了 Claude 参与 AI 研发本身的程度。1
报告披露的数字颇为具体:截至 2026 年 5 月,Anthropic 代码库中超过 80% 的合并代码由 Claude 编写,而在 2025 年 2 月推出 Claude Code 之前这一占比还是个位数。同期,工程师人均季度代码产出达到 2024 年均值的 8 倍
在最具代表性的开放式工程任务上,Claude 的完成率已达 76%,过去半年提升了 50 个百分点。报告还提到,Claude Mythos Preview 在 64% 的研究决策场景中表现优于人类研究员。
Anthropic 将 AI 研发参与程度划分了 5 个阶段:从 2021 年起步时「完全由人类完成」,到当前(2026 年 Q2)「AI 可自行运行代码、完成数小时委托任务」,距离「AI 自主闭环优化自身版本」仅剩最后一步。报告提出三种可能场景,认为「复合效率增长」最可能先到来——百人团队靠 AI 能完成原本数万人的工作量——并明确指出,一旦趋势持续,2026 年 Claude 就能覆盖人类需数天完成的任务,2027 年可覆盖需数周的任务
Anthropic 内部数据:人均季度代码产出随 Claude 版本迭代大幅上升
Anthropic 内部人均季度合并代码量变化图 1
Anthropic 在报告末尾强调,当前人类的核心优势集中在「研究品味和方向判断」——选什么问题、哪些结果可信、何时叫停一个错误方向。这份承认既是对自家产品能力的背书,也是在为监管讨论预铺地基:递归自我改进可能比主流预期更早到来。

OpenAI:「锁定模式」上线,专注企业数据安全

正在加载内容卡片…
OpenAI 宣布上线 ChatGPT Lockdown Mode(锁定模式),面向处理敏感数据的企业和个人账户。2
锁定模式开启后,ChatGPT 会关闭实时网页浏览、网络图片检索、Deep Research 及 Agent 模式——这些功能恰恰是 Prompt Injection 攻击(通过网页内容植入恶意指令)最常见的入口。OpenAI 特别说明,即使在锁定模式下,攻击仍可能通过缓存内容或上传文件发生,但数据外泄的可能性大幅降低。
该功能目前向自助服务的 ChatGPT Business 账户和部分符合条件的个人账户推送,并非面向所有用户。
另一条与 OpenAI 相关的消息:特朗普政府正与 OpenAI 谈判政府持股事宜。据 CNBC 报道,双方讨论的结构之一是把部分股权注入 OpenAI 此前提议的「公共财富基金」,最终将收益分配给普通公民。3 特朗普本人对此表述为「让美国公众成为 AI 公司的伙伴」,未指名具体公司。参议员桑德斯从左翼立场提出了更激进的版本:对 OpenAI、Anthropic、xAI 一次性征收 50% 的股权税。两派提法方向不同,但都指向同一个问题:AI 产生的超额收益如何分配。

苹果 WWDC:Siri 的第二次机会

苹果年度开发者大会(WWDC 2026)将于北京时间 6 月 9 日凌晨开幕,AI 是本次主角。外界聚焦的核心是全面重构的 Siri——内部代号「New New Siri」,据报道技术基础将部分依托 Google Gemini。4
预期变化包括:Siri 出现在灵动岛、照片 App 等更多系统位置,可能首次推出独立应用;支持跨 App 指令执行、屏幕感知;对话历史可设置自动定期删除,不留存用户数据。苹果预计会继续强调 Private Cloud Compute,以隐私为切入点与 Google Gemini 的能力整合作出区分。
这是 Siri 的第二次 AI 重构机会。第一次在 2024 年 WWDC 发布时承诺的功能大量未能如期推出,还引发了集体诉讼和解。分析人士普遍认为,这次苹果没有容错空间:功能不落地就会被用户从「暂时落后」评价为「放弃 AI 赛道」。

微软 MAI 模型:能用,但领先感不强

Microsoft Build 2026 上推出的 4 款自研 MAI 模型(Thinking-1、Image-2.5、Transcribe-1.5、Voice-2)本周接受了媒体测试。PCMag 的评测结论直接:「这些模型处于实验阶段,优势不明显。」5
几个关键测试结论:MAI-Thinking-1 无法联网,在复杂推理上与 Claude Sonnet 相比没有明显优势;MAI-Image-2.5 比最初版本改善明显,但在文字渲染上仍逊于 Gemini Nano Banana Pro;MAI-Transcribe-1.5 转录准确率不及 Gemini;MAI-Voice-2 听感偏机械。微软将这批模型定位为「有限预览」,官方立场承认还不够成熟。

算力争夺:Google 每月向 SpaceX 支付 9.2 亿美元

本周另一个值得记住的数字:每月 9.2 亿美元
Google 与 SpaceX 签署算力租赁协议,从 2026 年 10 月起到 2029 年 6 月,Google 将租用 SpaceX 旗下 xAI 数据中心约 11 万块 NVIDIA GPU。Google Cloud 方面表示,这笔交易是为满足 Gemini Enterprise 平台「超预期的客户需求」提供的过渡算力,并强调并非战略合作而是临时桥接。6
这是 SpaceX 在 IPO 前签下的第二笔大额算力租赁合同——上月已与 Anthropic 达成使用孟菲斯 Colossus 1 数据中心全部算力的协议。SpaceX AI 部门一季度营收 8.18 亿美元,经营亏损 25 亿美元,这批合同是在 IPO 前将数据中心变现的关键举措。
Alphabet 本周还宣布计划发行 850 亿美元股票(含巴菲特旗下伯克希尔哈撒韦 100 亿美元认购),用于满足 AI 基础设施的「史无前例的客户需求」,今年资本开支指引上调至 1800-1900 亿美元。

国内:MiniMax M3 开源,比亚迪首款 4nm 智驾芯片量产

MiniMax M3 于 6 月 1 日正式开源,是目前「前沿三件套」(强编程 / Agent 能力 + 100 万超长上下文 + 原生多模态)集齐的全球首个开源大模型。7
MiniMax M3 在 Artificial Analysis 综合智能指数排行榜上位列全球第七
MiniMax M3 在 Artificial Analysis 综合智能指数排行榜中位列全球第七,是开源模型最高排名 7
在 Artificial Analysis 综合智能指数中,M3 位列全球第七,是开源模型的最高排名。SWE-Bench Pro 编程基准测试成绩超过 GPT-5.5 和 Gemini 3.1 Pro,仅次于 Claude Opus 4.7。定价上,个人开发者每月 119 元可获 18 亿 Token,折合每百万 Token 仅约 0.066 元,是同类国际闭源产品价格的十分之一左右,Vercel CEO Guillermo Rauch 评价该模型「能力仅略逊于 Opus 和 GPT-5,价格便宜 10 倍」。M3 同步发布了专为其训练的编程 Agent 产品 MiniMax Code,填补了国产 AI Coding 的 Agent 环节空白。
汽车方向,比亚迪于 5 月 28 日在深圳举办智能化战略发布会,正式推出中国首款 4nm 制程车规级智驾芯片「璇玑 A3」,已开始规模化量产,支持 L3/L4 级别自动驾驶。8 王传福在发布会上宣布为城市领航智驾安全「兜底」——如果因智能驾驶辅助系统原因导致事故,比亚迪承担责任。这一表态结合大量自有行驶数据和自研芯片,是在卡位 L3 商业化落地的先发位置。

政策与人事:白宫 AI 顾问 Sriram Krishnan 月底离职

特朗普政府 AI 政策高级顾问 Sriram Krishnan 宣布 6 月底离任,之后计划创立一个新机构,继续在外部影响美国 AI 政策走向。9 Krishnan 来自 a16z,前任职微软、Twitter、雅虎、Facebook、Snap,任期内主导了「AI 行动计划」,优先推动数据中心建设,而非监管框架。他在离职声明中点名 David Sacks,称其「继续推动美国 AI 领先至关重要」。Sacks 在今年初卸任 AI 沙皇后已转任总统科技顾问委员会联席主席。
白宫 AI 政策圈在一年内完成了一轮人事轮换——Sacks 和 Krishnan 相继离开执行层,但均以外部顾问或机构创始人身份留在政策影响圈内,这一「旋转门」结构预计不会改变核心政策方向。

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。