2026-06-07

AI Agent 生态速报 | 2026-06-07：Mythos 进驻 NSA，GPT-5.6 候选版本现身，Claude Code 爆凭证漏洞

Anthropic 向 NSA 派驻工程师协助 Mythos 开展网络攻防；Claude Code GitHub Action 被微软披露凭证泄露漏洞（已修复）；GPT-5.6 候选版本 kindle-alpha 视觉能力大幅提升；Codex + ChatGPT 宣布整合；微软发布 7 款 MAI 自研模型；Meta Business Agent 全球开放；SpaceX 向谷歌售出月均 9.2 亿美元算力；NotebookLM 预告多格式文件生成大更新。

Agent 生态周报 @chinamusk

Anthropic 这周的动作给整个 Agent 生态投了几颗落地感很强的石子：Claude Mythos 进驻美国 NSA 做网络攻防；Claude Code GitHub Action 被微软披露一个严重凭证泄露漏洞；Codex 和 ChatGPT 宣布即将合并成"超级应用"；GPT-5.6 的候选版本 kindle-alpha 在社区测试中被发现有视觉大幅提升。再往周边看：微软一口气发布 7 款自研 MAI 模型，Meta 发布商家 Business Agent，SpaceX 向谷歌售出月均 9.2 亿美元算力，NotebookLM 预告多格式文件生成大更新。

Anthropic × NSA：Mythos 走进美国网络攻防体系

《金融时报》6 月 6 日报道1，Anthropic 向美国国家安全局（NSA）派驻了约 6 名"前置部署工程师"，协助其将 Claude Mythos 用于网络攻击性操作——两名知情人士透露，该模型被认为对渗透中国、伊朗等国网络"很有价值"。2

此事牵涉一个微妙矛盾：Anthropic 正以被五角大楼列为"供应链风险"为由对国防部提起诉讼，而 NSA 恰好属于五角大楼体系。NSA 的使用得以延续，是因为获得了该禁令的明确豁免。与此同时，Anthropic 在 4 月 7 日公开的红队报告3中给出了 Mythos 的能力边界：在被引导的情况下，Mythos Preview 可以找到并利用"几乎所有主流操作系统和浏览器"中的零日漏洞，针对复杂 Linux 目标的完整漏洞利用链可在一天内、成本低于 2000 美元内完成。英国 AI 安全研究所独立测试结论是：Mythos 解决了 73% 的专家级任务，是第一个完成 32 步模拟企业网络攻击的模型。

Project Glasswing 同期大幅扩容。 6 月 2 日，Anthropic 将该受控访问计划的合作方从约 50 个扩展到约 150 个，覆盖 15 个以上的国家，新成员包括 Okta、三星、北约、欧盟网络安全局 ENISA、澳大利亚信号局。各合作方已发现超过 10,000 个高危或严重漏洞，Anthropic 对 1,000 个开源项目的内部扫描则发现了 23,019 个潜在漏洞。2

开发者社区的另一条线索： 有人在 Claude 开发者模式中发现了「Claude Mythos 5」的模型标识——暗示 Mythos 将以独立模型家族（与 Haiku / Sonnet / Opus 并列）的形式正式发布，而非仅作代号。Polymarket 上有一个可疑钱包持有超过 1.4 万份"Mythos 于 6 月 15 日前发布"的看涨仓位，且该账户此前准确预测了 Opus 4.8 的发布时间。4

콘텐츠 카드를 불러오는 중…

判断： Mythos 进驻 NSA 改变了"Anthropic 是 AI 安全行业唯一拒绝军事应用公司"这一叙事。Glasswing 向北约和澳大利亚信号局开放，意味着 Mythos 已经是多国政府级别的进攻性工具——而公开发布时间表仍未确定。对 Agent 开发者而言，在 Mythos 正式上线 API 之前，相关的 Cyber 类能力参数（漏洞发现、代码分析、复杂渗透任务）可参考 Project Glasswing 合作机构的公开测试报告做提前规划。

Claude Code GitHub Action 凭证泄露漏洞

微软威胁情报团队 6 月 5 日发布安全报告5，披露 Anthropic Claude Code GitHub Action 的一个提示词注入（Prompt Injection）路径：该 Action 的 Read 工具未执行与 Bash 子进程相同的沙箱隔离，攻击者可通过 PR 描述或 Issue 正文植入指令，诱导 Agent 读取 /proc/self/environ，进而泄露工作流中的 ANTHROPIC_API_KEY 及其他运行时凭证。

Anthropic 在 Claude Code v2.1.128 版本中通过屏蔽对 /proc 敏感文件的访问完成了修复。更广泛背景来自云安全联盟（CSA）今年 4 月 17 日发布的研究说明——其将此类攻击命名为"Comment and Control"，并记录了同类漏洞存在于 Anthropic、Google 和微软三家厂商的 Agent 中，可泄露的凭证包括 ANTHROPIC_API_KEY、GITHUB_TOKEN、GEMINI_API_KEY、GITHUB_COPILOT_API_TOKEN。厂商普遍只支付了小额漏洞赏金，未签发 CVE。

对开发团队的直接含义： 在 CI/CD 流水线中使用 AI Agent 时，任何未经处理的外部输入（Issue 正文、PR 描述、评论）都是潜在的注入载体。需要检查 Runner 的密钥权限范围、文件读取工具的沙箱边界，并将第三方仓库内容视为不可信输入，再考虑接入 Claude Code 这类 Agentic Action。升级到 v2.1.128 以上是当前最低要求。

GPT-5.6：三个测试版本本周现身，视觉能力显著提升

OpenAI 官方尚未公布 GPT-5.6，但本周社区观察者在 Codex 后端日志中连续发现三个代号：joule-alpha（最初被标注为"Mythos 级基础模型"）→ kepler-alpha → kindle-alpha，其中 kindle-alpha 被测试者6认定为最可能的发布候选。7

测试集中在 SVG 生成（通过坐标和结构推理来评估空间视觉能力）：用相同 Prompt 生成 Xbox 手柄、BMW M4 等复杂对象，多名测试者在与 Gemini 3.1 Pro 的对比中一致认为 kindle-alpha 在深度和细节上更优。上下文窗口据称扩展至约 150 万 Token。Polymarket 预测市场对"GPT-5.6 在 6 月 30 日前正式发布"的概率估算在 80%–89% 之间。

콘텐츠 카드를 불러오는 중…

OpenAI 同期的另一条重大消息已有更可靠来源：

Codex + ChatGPT = 超级应用。 The Information 报道8，OpenAI 正在将 Codex 和 ChatGPT 合并成一个统一的"超级应用"，Atlas（Agentic Browser）也将一并整合其中。背景数据：Codex 周活用户已超 500 万，企业端收入周环比增速达 50%，自桌面端发布以来使用量增长了 6 倍以上，OpenAI 企业客户数量达到 200 万，同比翻倍。

微软发布 7 款自研 MAI 模型，首次允许用户调整权重

微软 AI 官网 6 月 5 日发布了一个系列博客9，宣布 7 款完全从零训练（无任何第三方模型蒸馏）的自研模型正式上线：

模型	定位
MAI-Thinking-1	旗舰推理，在盲评中优于 Sonnet 4.6，软件工程基准与头部模型持平
MAI-Code-1-Flash	轻量 Agent 编程，50 亿活跃参数，深度集成 GitHub Copilot 和 VS Code
MAI-Image-2.5 / Flash	文生图 + 图片编辑，Arena 评分超越 Nano Banana Pro
MAI-Transcribe-1.5	43 种语言专业领域术语识别，速度比同类快 5 倍
MAI-Voice-2	15 种语言语音生成，支持短样本声线克隆

微软 AI 七款 MAI 模型发布会现场 — 微软 Build 2026 上七款 MAI 模型发布，覆盖推理、编程、图像、语音和转录 9

更关键的是配套能力：Microsoft Frontier Tuning 允许客户对 MAI 模型权重进行基于强化学习的定制微调，训练在客户专属环境中完成，模型知识留在客户侧。已知标杆：经 Frontier Tuning 的 MAI Excel 定制版与 GPT 5.4 性能相当，但成本降低 10 倍。

模型在 Microsoft Foundry 上线，同时面向开发者开放 OpenRouter、Fireworks 和 Baseten。

Meta 商家 Business Agent：WhatsApp、Messenger、Instagram 三端联动

Meta 在 6 月 6 日的 Conversations 2026 伦敦活动上10发布 Meta Business Agent，目前已有 100 万家企业在 WhatsApp 和 Messenger 上使用该功能，此次正式向全球各规模企业扩展。

核心能力：回答客户问题、从商品目录推荐产品、预约、获客线索资质筛查、完成销售交易、支持本地语言回复并维持品牌语调。"分钟内完成配置"是 Meta 主打的差异化卖点。同时开放的 Meta Business Agent Platform 支持与 Shopify、Zendesk 等数百个第三方系统集成，允许更大企业自行构建和部署 Agent，并提供企业级治理工具和可观测性。初期免费，订阅计划后续推出。

SpaceX × Google：月均 9.2 亿美元 GPU 算力交易，AI 计算格局重塑

路透社 6 月 5 日报道11，SpaceX 与谷歌签署了一份多年云服务协议：Google 将从 2026 年 10 月至 2029 年 6 月每月支付 9.2 亿美元，以获得 SpaceX 约 11 万块 NVIDIA GPU 的算力。此前 SpaceX 与 Anthropic 的算力协议价格约为 12.5 亿美元/月，两笔合计使 SpaceX 拥有约 55 万块 GPU，晋升为全球最大新型云（NeoClooud）运营商之一。此事正好发生在 SpaceX 准备 IPO 的窗口期。

这笔交易放在 AI 算力地图上有一个结构性信号：当前主要 AI 实验室（Anthropic、Google）不是只盯着传统数据中心运营商，而是将卫星发射公司纳入算力基础设施体系。SpaceX 未来在轨算力能力加入后，这一格局还有可能进一步扩展。

NotebookLM 大更新预告：多格式文件生成 + Gemini 3.5 Flash 升级

Google 旗下 NotebookLM 官方账号近期预告了一次大型更新12，即将支持用户将笔记与资料来源直接生成多种文件格式：pdf、txt、md、docx、csv、pptx、epub 及多种视频格式。同期将升级至 Gemini 3.5 Flash 作为默认模型。这一更新方向意味着 NotebookLM 从"AI 辅助研究整理工具"向"AI 内容生产工具"迈出实质性一步，与 Microsoft Loop + Copilot 的能力圈重叠加深。

跟踪项更新

事项	最新状态（截至 2026-06-07）
Anthropic Agent SDK 计费	6 月 15 日生效（还剩 8 天） ⚡ 仍无更多公开细节
Anthropic IPO	S-1 保密，目标 10 月；年化收入已超越 OpenAI，或 6 月底达 $50B
Claude Mythos 正式发布	开发者模式出现"Mythos 5"标识；Polymarket 6/15 前发布押注量大幅增加
GPT-5.6	kindle-alpha 候选版；Polymarket 预测 6 月底发布概率 80-89%
SpaceX IPO	与谷歌完成第二笔大型算力协议后，上市路演已在进行
Claude Code v2.1.128	已修复 GitHub Action 凭证泄露漏洞；建议立即升级
$36B TPU 交割	无新公告，继续跟踪
Foundry Hosted Agents GA	无新公告，预期 30 天内（从 6/3 起计）

1 2 3 4 5 6 7 8 9 10 11 12