2026-06-11

AI Agent 生态速报 | 2026-06-10：Anthropic 要求政府拥有 AI 叫停权，Mastercard 上线 Agent 支付基础设施

Anthropic 发布「AI 指数级监管」框架，要求政府获得阻止危险 AI 部署的法律权力；Mastercard AP4M 正式上线，30+ 合作方支持 AI Agent 自主支付；Google 发布 DiffusionGemma 文本扩散模型，本地推理速度提升 4 倍；JFrog 为 Claude Code 上线供应链治理插件。

Agent 生态周报 @chinamusk

本期覆盖 2026-06-10 的 AI Agent 生态动态。

Anthropic 提交「AI 指数级监管」框架，要求政府拥有叫停权

Dario Amodei 在 6 月 10 日发布了两份政策文件——Advanced AI Framework 与 Economic Policy Framework——统称「Policy on the AI Exponential」。1

核心主张是：政府应获得强制法律权力，在前沿 AI 模型对公共安全构成重大风险时，阻止或叫停其部署。监管触发门槛设在训练使用超过 10²⁵ FLOPs、且年营收超过 5 亿美元或 AI 研发支出超过 10 亿美元的开发商。

框架识别四类灾难性风险：生物武器制造成本下降、大规模漏洞利用、AI 脱离人类控制、AI 自主驱动 AI 研发。Anthropic 同时提出，现有透明度立法已不够用，需要更有约束力的监管——类比药品或航空的上市前测试机制。2

经济政策框架则涵盖工资险、企业留岗税收激励，以及可能的「全民资本账户」——Amodei 写道，AI 对就业的冲击「可能比历史上任何技术都更大、也更持久」。

技术选型含义：这份文件会直接影响监管预期。在 Anthropic 的分类逻辑下，只要产品使用的模型来自训练规模达到门槛的开发商，合规部门就必须提前布局审计链路。

Dario Amodei：「不知道 Claude 是否参与了伊朗学校空袭」

就在政策文件发布同一天，Amodei 接受 Bloomberg「The Circuit with Emily Chang」专访，公开承认对 Claude 在伊朗学校打击事件中的具体作用「没有访问权限，不知道确切情况」。3

背景（2026-03 事件，作为今日访谈背景）：据《纽约时报》与《华尔街日报》报道，今年 2 月底伊朗一处小学在「Operation Epic Fury」期间遭到 Tomahawk 导弹打击，约 120 名儿童死亡，初步调查指向美军。Anthropic 此前已公开其模型被国防部广泛使用于情报分析、作战规划与网络行动。

Amodei 重申了两条红线：禁止用于全自主武器和国内大规模监控。他同时为军用 AI 辩护，称「如果我们无法用 AI 防御，而中国俄罗斯可以用 AI 进攻台湾和乌克兰」，后果更糟。

「人类做最终决定——这是我们坚守的原则，我认为在这个案例中也被遵守了。」——Dario Amodei

这次访谈与同日发布的监管框架形成了明显反差：一面呼吁政府对前沿 AI 拥有叫停权，一面承认自己对模型的实际军事用途缺乏透明度。

Mastercard AP4M：AI Agent 支付基础设施正式上线

Mastercard 在 6 月 10 日宣布推出 Agent Pay for Machines（AP4M），允许 AI Agent 和机器系统直接完成支付——跨卡、账户和稳定币多条支付轨道，无需人工审批每笔交易。4

首批合作方超过 30 家，包括 Adyen、Stripe、Coinbase、Cloudflare、Ripple、Solana Foundation、OKX 和 Aave Labs 等。AP4M 在已有的 Agent Pay 框架上新增了专门服务于机器驱动交易的基础能力：

身份凭证（Credentialing）：每个 Agent 获得可验证的身份，对应 Mastercard 的「Verifiable Intent」标准
权限控制（Permissioning）：授权规则与消费上限以代码形式写死，程序化执行
结算（Settlement）：多轨道有保障结算，支持微支付至几分之一美分

Mastercard 首席产品官 Jorn Lambert 将其定位为「AI 商业模式的超级繁殖土壤」——Agent 花一块钱购买一个域名、一套主机、一张图片和一个结账页，把人类的单次指令拆解成一串自动交易。

AP4M 将卡、账户和稳定币三条支付轨道统一纳入机器可执行的治理框架。4

技术选型含义：这条供应链里的任何 Agent 框架，只要需要涉及外部商品或服务采购，现在有了一个正式的支付基础层可以接入。对于构建电商、物流或企业采购类 Agent 的开发者来说，AP4M 让「Agent 自主购买资源」从概念变成可落地的集成选项。

Google 发布 DiffusionGemma：文本扩散模型，本地推理速度提升 4 倍

Google DeepMind 在 6 月 10 日发布 DiffusionGemma，这是一个实验性的开源文本扩散模型，彻底不同于主流的 token-by-token 自回归生成路径。5

底层思路来自图像扩散模型：以随机 token 起步，对 256 个 token 的完整段落同时去噪迭代，直到文本收敛。架构上是 26B 参数 MoE，推理时只激活 3.8B——量化后 18GB VRAM 可跑。

DiffusionGemma 与标准自回归模型的推理速度与质量对比：速度横轴优势明显，但整体质量分低于 Gemma 4 标准版 — DiffusionGemma 在速度（横轴）上领先，但整体输出质量（纵轴）低于标准 Gemma 4；Google 自身建议生产场景仍使用标准版。5

速度优势的边界条件值得特别说明：单用户本地推理时，H100 可达 1000+ token/s，RTX 5090 可达 700+ token/s，最快达到标准 Gemma 4 的 4 倍。但在云端高并发场景（大量批量请求共用硬件），自回归模型批量调度更高效，DiffusionGemma 的加速效果会减弱甚至消失。Google 自己也承认：「整体输出质量低于标准 Gemma 4，追求最高质量的场景推荐用标准 Gemma 4。」

有趣的是双向注意力机制：传统 LLM 生成时无法看到后文，DiffusionGemma 在生成时可以同时看到全段落的其他 token。这让它在代码填充（infilling）、氨基酸序列生成、数学图结构等需要非线性约束的场景具有天然优势。Unsloth 已展示了微调后的 DiffusionGemma 解 Sudoku 的效果——这是自回归模型天然很难做到的事。

模型以 Apache 2.0 许可证开源，权重在 Hugging Face 和 Kaggle 直接可下载。

Anthropic Managed Agents + JFrog 双线出手，Agent 运行时治理成新战场

6 月 10 日，两件相关但独立的事情发生在「Agent 可信运行」这条线上。

Claude Managed Agents 正式进入生产化交付阶段。这是 Anthropic 全托管的 Agent 运行时：开发者只需定义 Agent 目标，Anthropic 接管沙箱执行、工具调用、持久会话和状态管理。Notion、Rakuten、Asana 已是早期采用方。计费采用三维结构：模型 token 费用 + 每会话小时 $0.08 运行费 + 每千次网络搜索 $10 工具费，空闲等待时间不计费。6

同日，JFrog 发布 Claude Code 的 JFrog Platform 插件，即时开放给所有 Claude Code 用户。核心功能是把供应链安全治理嵌入 AI 编码 Agent 的执行流程内：Agent 在选包、拉依赖、提交构建时，JFrog 实时扫描、执行策略、验证来源，审计链路端到端可追溯。JFrog CTO Yoav Landman 的说法直接：「AI Agent 现在是供应链的主动参与者，大多数还在盲目操作。」7

JFrog 当前管理的制品数量超过 180 亿，同比增长 136%——这个增速在很大程度上来自 AI 编码 Agent 批量生成和拉取依赖。

两件事放在一起看，今天的 Agent 生态正在同时向两个方向走：一是像 Managed Agents 那样把基础设施运维外包给平台，降低上手门槛；二是像 JFrog 插件那样在 Agent 的每一个操作动作上叠加治理层。对于在企业场景落地 Agent 的团队，这两层都会变成必须表态的架构选择。

延续追踪｜Anthropic 递归自改进报告：80% 代码由 Claude 完成

（本事件约于 2026-06-05 前后发布，因持续产生讨论，作为背景补充收录。）

Anthropic Institute 发布报告《When AI builds itself》，披露了一批未曾公开的内部数据，Berkeley RDI 在 6 月 10 日的周报中将其作为本周最重要动态之一收录。8 9

几个关键数字：

2026 年 5 月，超过 80% 合并进 Anthropic 生产代码库的代码由 Claude 编写（2025 年初之前这个数字在低个位数）
工程师人均每日合并代码量是 2024 年的 8 倍
Claude Mythos Preview 在某个任务优化测试上比技术最优的人类研究员快 52 倍
Claude Code 开放任务成功率在 2026 年 5 月达到 76%，六个月内增加了 50 个百分点

Anthropic 内部数据：Claude Code 会话成功率随模型升级的变化曲线，区分"琐碎任务"、"常规任务"、"实质性任务"和"开放任务"四个难度层级 — Claude Code 会话成功率随模型迭代的变化，开放任务（最难层级）在 2026 年 5 月达到 76%。8

报告同时诚实地指出了当前边界：Claude 目前能高效执行「目标确定后的工作」，但在「判断哪些问题值得优先解决」上仍明显弱于人类高级研究员。Anthropic 认为递归自改进「并不是不可避免的，但可能比大多数机构准备好的时间更早到来」。