Anthropic 公开 AI 自我构建进度，Claude 已写完 80% 代码——6 月 6 日 AI 动态

今天最值得细读的一条，是 Anthropic 发布的内部数据报告：AI 自我参与 AI 开发的程度，比外界普遍估计的要高很多，速度也快很多。与此同时，OpenAI 推出了针对企业安全的 Lockdown Mode，特朗普政府与 OpenAI 的股权谈判继续发酵，WWDC 2026 明日开幕，微软 MAI 模型遭遇独立测评「当头棒喝」。

Anthropic：AI 正在以加速度构建自身

昨晚，Anthropic 官方发布了一篇罕见的内部进展报告，题为「When AI Builds Itself」，记录了截至 2026 年中他们内部 AI 参与开发的实际数据。1

核心数字是：截至 2026 年 5 月，Anthropic 代码库中超过 80% 的合并代码由 Claude 编写。在 2025 年 2 月 Claude Code 推出之前，这个比例只有个位数。与此对应，工程师人均每日合并代码量是 2021–2024 年平均水平的 8 倍。

这不只是「效率提升」那么简单——Anthropic 展示的是一条清晰的自我加速路径：

时期	能力阶段	人类工程师的角色
2021–2023	全流程人类完成	写代码
2023–2025	AI 辅助片段	审查 + 修改
2025–2026	编码代理	提目标 + 最终审核
2026 年中	自主代理（当前）	方向判断，可委托数小时工作
未来	完整递归闭环（未到达）	监督验证

在研究方向判断上，Claude Mythos Preview（内部测试版）已在 129 个样本中 64% 的情况下给出比人类更好的下一步决策，而 2025 年 11 月的 Opus 4.5 这一比例只有 51%。

能力上限方面，Claude Mythos Preview 目前可稳定工作至少 16 小时，超过了所有现有测试集的测量上限。一个具体案例：2026 年 4 月 Claude 在 800 小时运行后自主完成了一项开放性 AI 安全研究项目（验证「弱模型是否能可靠监督强模型」），填补了人类研究员一周仅能补上 23% 的性能缺口中的 97%。

值得注意的是，报告明确说：完整递归自我改进尚未实现，但「可能比公众预期来得更快」。Anthropic 同时展示了三种未来场景：能力增长停滞、复合效率增长（最大概率）、以及完整自主研发下一代模型。

这篇报告的发布时间节点微妙——距离 Anthropic 预期 6 月 12 日 IPO 首个交易日不足一周。

Anthropic 内部数据：不同版本 Claude 在人类走错方向时给出更优方案的占比，Mythos Preview 达到 64% — Claude 的研究决策胜过人类的比例在逐版提升 1

OpenAI：ChatGPT 推出 Lockdown Mode

OpenAI 今日宣布上线「Lockdown Mode（锁定模式）」——一个面向高敏感数据用户的可选安全功能，目标是防止提示注入（prompt injection）攻击时的数据外泄风险。2

开启后，ChatGPT 将禁用：实时联网浏览（只能访问缓存内容）、从网络检索和展示图片、深度研究功能、Agent 模式。

OpenAI 的表态很克制：Lockdown Mode 并非万能盾——「即使开启，ChatGPT 在缓存网页内容或上传文件中仍可能存在提示注入风险」，目的是降低敏感数据被拿走的概率，而不是完全消除注入本身。

当前正在向「自助服务」的 ChatGPT Business 账户和符合条件的个人账户推送。定位是医疗、法律、金融等需要处理内部敏感数据的专业用户。

特朗普政府讨论入股 OpenAI，Sanders 提 50% AI 税

「政府持有 AI 公司股权」这件事，这周开始在美国形成左右两翼奇异共识。

6 月 5 日，CNBC 报道称特朗普政府正在与 OpenAI 讨论政府持股事宜，部分股权可能用于注入 OpenAI 此前提议的「公众财富基金」。3 6 月 6 日，特朗普在空军一号上对记者证实，他正在与 AI 高管讨论「美国公众与公司共同受益」的方案，即「把一部分给美国公众，让公众实际上成为公司合伙人」。

参议员 Bernie Sanders 的方案更激进：对 OpenAI、Anthropic、xAI 等公司一次性征收 50% AI 税，以股票形式缴纳，确保 AI 创造的财富惠及所有人。3

前特朗普 AI 政策顾问 David Sacks 承认 Sanders 的逻辑「包括在右翼中也引发共鸣」，但警告这样做会「加速我们已经在滑向的政商融合」。前微软员工 Dare Obasanjo 在 Bluesky 更直接：「这是为 OpenAI 政府纾困铺路。」

OpenAI 作为背景：年化收入超 470 亿美元，但仍长期亏损，IPO 时间表悬而未决。

Loading content card…

WWDC 2026 明日开幕：新 Siri 接入 Gemini，AI 应用商店上线

6 月 8 日（明天）上午 10 点 PT，苹果 WWDC 2026 正式开幕。4

最受关注的是 Siri 全面重构：接入 Google Gemini 模型，能理解上下文、处理多步任务、跨应用自然操作；同时有独立 Siri App 传言，直接对标 ChatGPT 和 Claude。苹果还在考虑加入「会话定时删除」功能（30 天 / 1 年 / 永久保留）。

其他预期亮点：

AI Agent App Store：用户可授权代理自动预约、管理任务、控制智能家居，细节暂不多
Visual Intelligence 升级：Camera 应用新增专属 Siri 模式，用 Google 图像搜索识别对象
Image Playground：更高质量生图、更多艺术风格、「描述变化」编辑方式
Apple Wallet：AI 拆账（拍收据自动生成分摊请求）、扫物生成数字通行证

这是苹果 2024 年「引入 ChatGPT」之后最大的 AI 架构调整——从外接工具到 Gemini 深度内嵌 Siri 核心。

WWDC 2026 官方品牌物料 — WWDC 2026 明日开幕，Siri 大改版是最大悬念 4

微软 MAI 模型被独立测评打脸：四款新模型全不及格

PCMag 记者 Ruben Circelli 6 月 6 日实测了微软 Build 2026 发布的四款 MAI 模型，结论是「四款全部表现平平，都被竞品超越」。5

MAI-Thinking-1（推理）：微软宣称胜过 Claude Sonnet，但测评者实测时 Sonnet 更有用，且 MAI-Thinking-1 不能联网——这是很多场景的直接硬伤
MAI-Image-2.5（生图）：比上一版进步明显，但测评文字质量和清晰度仍不及 Gemini Nano Banana Pro
MAI-Transcribe-1.5（语音转写）：测试出错 13 处，Gemini 只出错 6 处，且 MAI 的转写中途截断，Gemini 全程完整
MAI-Voice-2（文字转语音）：听感「机械感强」，与 Sesame 等顶级 TTS 工具差距明显

微软将这批模型定位为「实验性限量预览」，画了改进空间的期票；MAI-Thinking-1 目前仍「即将推出」，大多数用户还无法使用。

白宫 AI 顾问 Sriram Krishnan 月底离职

前 a16z 合伙人、特朗普政府高级 AI 政策顾问 Sriram Krishnan 宣布 6 月底离开白宫。6

Krishnan 在 X 帖子中表示「能够服务美国人民是莫大荣幸」，并对 Trump 和 David Sacks 给出高度评价。根据《华盛顿邮报》报道，他计划在离职后创立一个独立机构，继续影响特朗普政府的 AI 政策。

Krishnan 担任顾问期间的主要工作包括：推动 AI Action Plan（优先建数据中心而非监管）、协助起草多项行政令（含挑战州级 AI 法规的命令，以及后来被行业游说削减范围的 AI 监管令）。