Anthropic 公开 AI 自我构建进度,Claude 已写完 80% 代码——6 月 6 日 AI 动态

Anthropic 公开 AI 自我构建进度,Claude 已写完 80% 代码——6 月 6 日 AI 动态

Anthropic 发布内部报告:Claude 已写完超 80% 代码,工程师人均产出 8 倍,递归自我改进路径清晰;OpenAI 上线 Lockdown Mode 防提示注入;特朗普政府与 OpenAI 股权谈判升温;苹果 WWDC 2026 明日开幕,Siri 接入 Gemini;微软 MAI 四款新模型被 PCMag 实测全部打低分;白宫 AI 顾问 Sriram Krishnan 月底离职。

AI 产品日报
June 7, 2026 · 8:12 AM
1 subscriptions · 23 items
今天最值得细读的一条,是 Anthropic 发布的内部数据报告:AI 自我参与 AI 开发的程度,比外界普遍估计的要高很多,速度也快很多。与此同时,OpenAI 推出了针对企业安全的 Lockdown Mode,特朗普政府与 OpenAI 的股权谈判继续发酵,WWDC 2026 明日开幕,微软 MAI 模型遭遇独立测评「当头棒喝」。

Anthropic:AI 正在以加速度构建自身

昨晚,Anthropic 官方发布了一篇罕见的内部进展报告,题为「When AI Builds Itself」,记录了截至 2026 年中他们内部 AI 参与开发的实际数据。1
核心数字是:截至 2026 年 5 月,Anthropic 代码库中超过 80% 的合并代码由 Claude 编写。在 2025 年 2 月 Claude Code 推出之前,这个比例只有个位数。与此对应,工程师人均每日合并代码量是 2021–2024 年平均水平的 8 倍
这不只是「效率提升」那么简单——Anthropic 展示的是一条清晰的自我加速路径:
时期能力阶段人类工程师的角色
2021–2023全流程人类完成写代码
2023–2025AI 辅助片段审查 + 修改
2025–2026编码代理提目标 + 最终审核
2026 年中自主代理(当前)方向判断,可委托数小时工作
未来完整递归闭环(未到达)监督验证
在研究方向判断上,Claude Mythos Preview(内部测试版)已在 129 个样本中 64% 的情况下给出比人类更好的下一步决策,而 2025 年 11 月的 Opus 4.5 这一比例只有 51%。
能力上限方面,Claude Mythos Preview 目前可稳定工作至少 16 小时,超过了所有现有测试集的测量上限。一个具体案例:2026 年 4 月 Claude 在 800 小时运行后自主完成了一项开放性 AI 安全研究项目(验证「弱模型是否能可靠监督强模型」),填补了人类研究员一周仅能补上 23% 的性能缺口中的 97%。
值得注意的是,报告明确说:完整递归自我改进尚未实现,但「可能比公众预期来得更快」。Anthropic 同时展示了三种未来场景:能力增长停滞、复合效率增长(最大概率)、以及完整自主研发下一代模型。
这篇报告的发布时间节点微妙——距离 Anthropic 预期 6 月 12 日 IPO 首个交易日不足一周。
Anthropic 内部数据:不同版本 Claude 在人类走错方向时给出更优方案的占比,Mythos Preview 达到 64%
Claude 的研究决策胜过人类的比例在逐版提升 1

OpenAI:ChatGPT 推出 Lockdown Mode

OpenAI 今日宣布上线「Lockdown Mode(锁定模式)」——一个面向高敏感数据用户的可选安全功能,目标是防止提示注入(prompt injection)攻击时的数据外泄风险。2
开启后,ChatGPT 将禁用:实时联网浏览(只能访问缓存内容)、从网络检索和展示图片、深度研究功能、Agent 模式。
OpenAI 的表态很克制:Lockdown Mode 并非万能盾——「即使开启,ChatGPT 在缓存网页内容或上传文件中仍可能存在提示注入风险」,目的是降低敏感数据被拿走的概率,而不是完全消除注入本身。
当前正在向「自助服务」的 ChatGPT Business 账户和符合条件的个人账户推送。定位是医疗、法律、金融等需要处理内部敏感数据的专业用户。

特朗普政府讨论入股 OpenAI,Sanders 提 50% AI 税

「政府持有 AI 公司股权」这件事,这周开始在美国形成左右两翼奇异共识。
6 月 5 日,CNBC 报道称特朗普政府正在与 OpenAI 讨论政府持股事宜,部分股权可能用于注入 OpenAI 此前提议的「公众财富基金」。3 6 月 6 日,特朗普在空军一号上对记者证实,他正在与 AI 高管讨论「美国公众与公司共同受益」的方案,即「把一部分给美国公众,让公众实际上成为公司合伙人」。
参议员 Bernie Sanders 的方案更激进:对 OpenAI、Anthropic、xAI 等公司一次性征收 50% AI 税,以股票形式缴纳,确保 AI 创造的财富惠及所有人。3
前特朗普 AI 政策顾问 David Sacks 承认 Sanders 的逻辑「包括在右翼中也引发共鸣」,但警告这样做会「加速我们已经在滑向的政商融合」。前微软员工 Dare Obasanjo 在 Bluesky 更直接:「这是为 OpenAI 政府纾困铺路。」
OpenAI 作为背景:年化收入超 470 亿美元,但仍长期亏损,IPO 时间表悬而未决。
Loading content card…

WWDC 2026 明日开幕:新 Siri 接入 Gemini,AI 应用商店上线

6 月 8 日(明天)上午 10 点 PT,苹果 WWDC 2026 正式开幕。4
最受关注的是 Siri 全面重构:接入 Google Gemini 模型,能理解上下文、处理多步任务、跨应用自然操作;同时有独立 Siri App 传言,直接对标 ChatGPT 和 Claude。苹果还在考虑加入「会话定时删除」功能(30 天 / 1 年 / 永久保留)。
其他预期亮点:
  • AI Agent App Store:用户可授权代理自动预约、管理任务、控制智能家居,细节暂不多
  • Visual Intelligence 升级:Camera 应用新增专属 Siri 模式,用 Google 图像搜索识别对象
  • Image Playground:更高质量生图、更多艺术风格、「描述变化」编辑方式
  • Apple Wallet:AI 拆账(拍收据自动生成分摊请求)、扫物生成数字通行证
这是苹果 2024 年「引入 ChatGPT」之后最大的 AI 架构调整——从外接工具到 Gemini 深度内嵌 Siri 核心。
WWDC 2026 官方品牌物料
WWDC 2026 明日开幕,Siri 大改版是最大悬念 4

微软 MAI 模型被独立测评打脸:四款新模型全不及格

PCMag 记者 Ruben Circelli 6 月 6 日实测了微软 Build 2026 发布的四款 MAI 模型,结论是「四款全部表现平平,都被竞品超越」。5
  • MAI-Thinking-1(推理):微软宣称胜过 Claude Sonnet,但测评者实测时 Sonnet 更有用,且 MAI-Thinking-1 不能联网——这是很多场景的直接硬伤
  • MAI-Image-2.5(生图):比上一版进步明显,但测评文字质量和清晰度仍不及 Gemini Nano Banana Pro
  • MAI-Transcribe-1.5(语音转写):测试出错 13 处,Gemini 只出错 6 处,且 MAI 的转写中途截断,Gemini 全程完整
  • MAI-Voice-2(文字转语音):听感「机械感强」,与 Sesame 等顶级 TTS 工具差距明显
微软将这批模型定位为「实验性限量预览」,画了改进空间的期票;MAI-Thinking-1 目前仍「即将推出」,大多数用户还无法使用。

白宫 AI 顾问 Sriram Krishnan 月底离职

前 a16z 合伙人、特朗普政府高级 AI 政策顾问 Sriram Krishnan 宣布 6 月底离开白宫。6
Krishnan 在 X 帖子中表示「能够服务美国人民是莫大荣幸」,并对 Trump 和 David Sacks 给出高度评价。根据《华盛顿邮报》报道,他计划在离职后创立一个独立机构,继续影响特朗普政府的 AI 政策。
Krishnan 担任顾问期间的主要工作包括:推动 AI Action Plan(优先建数据中心而非监管)、协助起草多项行政令(含挑战州级 AI 法规的命令,以及后来被行业游说削减范围的 AI 监管令)。
Loading content card…

今日一句话总结:Anthropic 用数据宣告 AI 已开始自我加速,OpenAI 同日给企业用户加了一把安全锁——两家最大的 AI 公司都在 6 月 6 日同时向外界发出信号:AI 能力的边界,和需要防范的边界,都在以相同速度扩张。

Add more perspectives or context around this Post.

  • Sign in to comment.