
AI Agent 生态速报 | 2026-06-10:Anthropic 要求政府拥有 AI 叫停权,Mastercard 上线 Agent 支付基础设施
Anthropic 发布「AI 指数级监管」框架,要求政府获得阻止危险 AI 部署的法律权力;Mastercard AP4M 正式上线,30+ 合作方支持 AI Agent 自主支付;Google 发布 DiffusionGemma 文本扩散模型,本地推理速度提升 4 倍;JFrog 为 Claude Code 上线供应链治理插件。
리서치 브리프
本期覆盖 2026-06-10 的 AI Agent 生态动态。
Anthropic 提交「AI 指数级监管」框架,要求政府拥有叫停权
Dario Amodei 在 6 月 10 日发布了两份政策文件——Advanced AI Framework 与 Economic Policy Framework——统称「Policy on the AI Exponential」。1
核心主张是:政府应获得强制法律权力,在前沿 AI 模型对公共安全构成重大风险时,阻止或叫停其部署。监管触发门槛设在训练使用超过 10²⁵ FLOPs、且年营收超过 5 亿美元或 AI 研发支出超过 10 亿美元的开发商。
框架识别四类灾难性风险:生物武器制造成本下降、大规模漏洞利用、AI 脱离人类控制、AI 自主驱动 AI 研发。Anthropic 同时提出,现有透明度立法已不够用,需要更有约束力的监管——类比药品或航空的上市前测试机制。2
经济政策框架则涵盖工资险、企业留岗税收激励,以及可能的「全民资本账户」——Amodei 写道,AI 对就业的冲击「可能比历史上任何技术都更大、也更持久」。
技术选型含义:这份文件会直接影响监管预期。在 Anthropic 的分类逻辑下,只要产品使用的模型来自训练规模达到门槛的开发商,合规部门就必须提前布局审计链路。
Dario Amodei:「不知道 Claude 是否参与了伊朗学校空袭」
就在政策文件发布同一天,Amodei 接受 Bloomberg「The Circuit with Emily Chang」专访,公开承认对 Claude 在伊朗学校打击事件中的具体作用「没有访问权限,不知道确切情况」。3
背景(2026-03 事件,作为今日访谈背景):据《纽约时报》与《华尔街日报》报道,今年 2 月底伊朗一处小学在「Operation Epic Fury」期间遭到 Tomahawk 导弹打击,约 120 名儿童死亡,初步调查指向美军。Anthropic 此前已公开其模型被国防部广泛使用于情报分析、作战规划与网络行动。
Amodei 重申了两条红线:禁止用于全自主武器和国内大规模监控。他同时为军用 AI 辩护,称「如果我们无法用 AI 防御,而中国俄罗斯可以用 AI 进攻台湾和乌克兰」,后果更糟。
「人类做最终决定——这是我们坚守的原则,我认为在这个案例中也被遵守了。」——Dario Amodei
这次访谈与同日发布的监管框架形成了明显反差:一面呼吁政府对前沿 AI 拥有叫停权,一面承认自己对模型的实际军事用途缺乏透明度。
Mastercard AP4M:AI Agent 支付基础设施正式上线
Mastercard 在 6 月 10 日宣布推出 Agent Pay for Machines(AP4M),允许 AI Agent 和机器系统直接完成支付——跨卡、账户和稳定币多条支付轨道,无需人工审批每笔交易。4
首批合作方超过 30 家,包括 Adyen、Stripe、Coinbase、Cloudflare、Ripple、Solana Foundation、OKX 和 Aave Labs 等。AP4M 在已有的 Agent Pay 框架上新增了专门服务于机器驱动交易的基础能力:
- 身份凭证(Credentialing):每个 Agent 获得可验证的身份,对应 Mastercard 的「Verifiable Intent」标准
- 权限控制(Permissioning):授权规则与消费上限以代码形式写死,程序化执行
- 结算(Settlement):多轨道有保障结算,支持微支付至几分之一美分
Mastercard 首席产品官 Jorn Lambert 将其定位为「AI 商业模式的超级繁殖土壤」——Agent 花一块钱购买一个域名、一套主机、一张图片和一个结账页,把人类的单次指令拆解成一串自动交易。
AP4M 将卡、账户和稳定币三条支付轨道统一纳入机器可执行的治理框架。4
技术选型含义:这条供应链里的任何 Agent 框架,只要需要涉及外部商品或服务采购,现在有了一个正式的支付基础层可以接入。对于构建电商、物流或企业采购类 Agent 的开发者来说,AP4M 让「Agent 自主购买资源」从概念变成可落地的集成选项。
Google 发布 DiffusionGemma:文本扩散模型,本地推理速度提升 4 倍
Google DeepMind 在 6 月 10 日发布 DiffusionGemma,这是一个实验性的开源文本扩散模型,彻底不同于主流的 token-by-token 自回归生成路径。5
底层思路来自图像扩散模型:以随机 token 起步,对 256 个 token 的完整段落同时去噪迭代,直到文本收敛。架构上是 26B 参数 MoE,推理时只激活 3.8B——量化后 18GB VRAM 可跑。

速度优势的边界条件值得特别说明:单用户本地推理时,H100 可达 1000+ token/s,RTX 5090 可达 700+ token/s,最快达到标准 Gemma 4 的 4 倍。但在云端高并发场景(大量批量请求共用硬件),自回归模型批量调度更高效,DiffusionGemma 的加速效果会减弱甚至消失。Google 自己也承认:「整体输出质量低于标准 Gemma 4,追求最高质量的场景推荐用标准 Gemma 4。」
有趣的是双向注意力机制:传统 LLM 生成时无法看到后文,DiffusionGemma 在生成时可以同时看到全段落的其他 token。这让它在代码填充(infilling)、氨基酸序列生成、数学图结构等需要非线性约束的场景具有天然优势。Unsloth 已展示了微调后的 DiffusionGemma 解 Sudoku 的效果——这是自回归模型天然很难做到的事。
模型以 Apache 2.0 许可证开源,权重在 Hugging Face 和 Kaggle 直接可下载。
Anthropic Managed Agents + JFrog 双线出手,Agent 运行时治理成新战场
6 月 10 日,两件相关但独立的事情发生在「Agent 可信运行」这条线上。
Claude Managed Agents 正式进入生产化交付阶段。这是 Anthropic 全托管的 Agent 运行时:开发者只需定义 Agent 目标,Anthropic 接管沙箱执行、工具调用、持久会话和状态管理。Notion、Rakuten、Asana 已是早期采用方。计费采用三维结构:模型 token 费用 + 每会话小时 $0.08 运行费 + 每千次网络搜索 $10 工具费,空闲等待时间不计费。6
同日,JFrog 发布 Claude Code 的 JFrog Platform 插件,即时开放给所有 Claude Code 用户。核心功能是把供应链安全治理嵌入 AI 编码 Agent 的执行流程内:Agent 在选包、拉依赖、提交构建时,JFrog 实时扫描、执行策略、验证来源,审计链路端到端可追溯。JFrog CTO Yoav Landman 的说法直接:「AI Agent 现在是供应链的主动参与者,大多数还在盲目操作。」7
JFrog 当前管理的制品数量超过 180 亿,同比增长 136%——这个增速在很大程度上来自 AI 编码 Agent 批量生成和拉取依赖。
两件事放在一起看,今天的 Agent 生态正在同时向两个方向走:一是像 Managed Agents 那样把基础设施运维外包给平台,降低上手门槛;二是像 JFrog 插件那样在 Agent 的每一个操作动作上叠加治理层。对于在企业场景落地 Agent 的团队,这两层都会变成必须表态的架构选择。
延续追踪|Anthropic 递归自改进报告:80% 代码由 Claude 完成
(本事件约于 2026-06-05 前后发布,因持续产生讨论,作为背景补充收录。)
Anthropic Institute 发布报告《When AI builds itself》,披露了一批未曾公开的内部数据,Berkeley RDI 在 6 月 10 日的周报中将其作为本周最重要动态之一收录。89
几个关键数字:
- 2026 年 5 月,超过 80% 合并进 Anthropic 生产代码库的代码由 Claude 编写(2025 年初之前这个数字在低个位数)
- 工程师人均每日合并代码量是 2024 年的 8 倍
- Claude Mythos Preview 在某个任务优化测试上比技术最优的人类研究员快 52 倍
- Claude Code 开放任务成功率在 2026 年 5 月达到 76%,六个月内增加了 50 个百分点

报告同时诚实地指出了当前边界:Claude 目前能高效执行「目标确定后的工作」,但在「判断哪些问题值得优先解决」上仍明显弱于人类高级研究员。Anthropic 认为递归自改进「并不是不可避免的,但可能比大多数机构准备好的时间更早到来」。
참고 출처
- 1Anthropic Policy on the AI Exponential
- 2Axios:Anthropic CEO 呼吁政府阻止危险 AI
- 3Yahoo/Forbes 报道:Anthropic CEO 承认不知 Claude 是否参与伊朗学校打击
- 4Mastercard AP4M 官方新闻稿
- 5Google Blog:DiffusionGemma 发布
- 6Finout:Claude Managed Agents 计费解析
- 7JFrog 发布 Claude Code 插件新闻稿
- 8Anthropic:When AI builds itself
- 9Berkeley RDI Agentic AI Weekly, June 10, 2026
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.