AI Agent 生态速报 | 2026-06-12：OpenAI 收购 Ona 给 Codex 装上云端大脑，Visa 为 Agent 开通支付，Google WebMCP 标准起步

今天发生的事情，很多值得记下来。OpenAI 用一笔收购给 Codex 装上了「云端大脑」；Visa 直接把支付轨道接入 AI Agent；Google 在浏览器里动了根本，WebMCP 让每个网页都能变成 Agent 的工具；AWS 的新 IDE 正式宣告了 Amazon Q 的退出；连 Anthropic 也首次要盈利了。以下是 2026 年 6 月 12 日 AI Agent 生态的核心动态。

OpenAI 收购 Ona，Codex 终于有了「家」

OpenAI 于 6 月 11 日宣布将收购 Ona（前身为 Gitpod），这家初创公司提供安全预配置的云端沙箱，让 AI Agent 在用户关掉电脑后仍能持续运行。Ona 现有约 200 万开发者用户，收购条款未披露，Ona CEO Johannes Landgraf 及团队将加入 Codex 部门。1

Ona 解决的是 Codex 架构上最明显的短板：任务中断。当前 Codex Agent 在会话超时或设备关机时就会丢失上下文和工具连接。Ona 提供的云端工作空间保持持久在线，沙箱可在任务结束后自动销毁，同时内置了基于哈希的应用阻断和凭证隔离，防止 Agent 意外暴露敏感数据。2

收购时机很说明问题。此前一天 OpenAI 透露 Codex 已超过 500 万周活用户（4 月时为 300 万），面对 Claude Fable 5 在长任务 benchmark 上的显著领先，OpenAI 需要一个基础设施层面的答案。Ona 集成后，Codex 将能处理数天跨度的代码迁移、多系统集成等任务，而不必每隔几小时重新加载上下文。

这是 OpenAI 2026 年完成的第六笔收购，节奏明显快于 2025 年全年的八笔。

Codex 增长数据

OpenAI Codex 编码 Agent 周活用户增长

周活用户

0+67.0%较4月增幅

占全球开发者（估）

0.0

2026年收购笔数

0+0.0%2025全年共8笔

統計カードを読み込んでいます…

Visa × OpenAI：Agent 拿到了信用卡

6 月 10 日，Visa 与 OpenAI 在旧金山支付论坛上宣布战略合作。核心是：Visa 的支付网络、Token 化凭证和欺诈监控基础设施将直接嵌入 OpenAI 产品，允许 AI Agent 在用户设定的规则和商户范围内自主完成购买。3

Visa CPO Jack Forestell 原话：「AI 对商业的改变将深过互联网或移动互联网。」

这与 OpenAI 今年 3 月叫停的 Instant Checkout 功能在架构上有根本区别：Instant Checkout 试图自建结账层，最终因税务合规问题失败且商户寥寥；Visa 合作直接复用每年处理 15 万亿美元交易的现有轨道，责任边界更清晰。技术已经就绪，剩下的挑战在于消费者是否愿意让 Agent 真的「刷卡」。

对于在 Agent 工作流中集成支付环节的开发者来说，这个合作预示着 OpenAI API 侧会出现官方支持的支付接口，具体接入文档尚未发布，需跟踪 OpenAI 开发者公告。

Google WebMCP：网页变成 Agent 的工具

Chrome 149 在 6 月 12 日开放了 WebMCP 的 Origin Trial，这是 Google 与 Microsoft 在 W3C Web ML 社区组共同推进的新 Web 标准草案。4

WebMCP 让开发者用两种方式把网站功能暴露给浏览器内 Agent：

命令式 API：注册带类型参数和 handler 函数的 JavaScript 工具，Agent 直接调用，无需截图或解析 DOM。
声明式 API：给现有 HTML 表单加注释，低改造成本适合大多数已有表单的网站。

这解决了浏览器 Agent 长期依赖「截图 → 猜测元素 → 点击」的脆弱链路。Expedia、Booking.com、Shopify、Credit Karma、TurboTax、Instacart、Target 等已在试验。

WebMCP 在协议栈里的定位是「Agent 访问网站」，与 MCP（Agent 访问基础设施）和 A2A（Agent 间协作）互补而非替代。对构建浏览器自动化或 Web Scraping 场景的开发者，这个标准值得关注：Origin Trial 期间不建议生产部署，但安全模型仍在明确中。

WebMCP 三层协议栈示意：MCP（基础设施）/ A2A（Agent 协作）/ WebMCP（网站工具化） — WebMCP 在 Agent 协议栈中的位置 4

AWS Kiro 上线，Amazon Q Developer 进入退场倒计时

AWS 于 5 月 7 日国际发布了 Kiro，这是 Amazon Q Developer IDE 插件的地基级替代品，不是功能更新。5

Kiro 的核心机制是「规格驱动开发」：用户输入需求后，IDE 先把它转化为 EARS 格式的正式需求文档，再生成架构设计和任务序列，然后才开始写代码。这个流程在工具层面让「跳过规格直接 vibe-code」变得困难。每个功能点会自动生成可追溯的需求文档，合规审计时不必事后补写。

Kiro 的关键时间节点：

日期	变化
2026-05-15	Amazon Q Developer 停止新用户注册
2026-05-29	Claude Opus 4.6+ 独占 Kiro，Q Developer 停留在 Opus 4.5
2027-04-30	Amazon Q Developer IDE 插件全面停止支持

Kiro 底层跑 Amazon Bedrock，在任务类型间自动路由 Claude Sonnet 4.5（推理/规格生成）和 Amazon Nova（高吞吐代码生成）。定价从免费（50 credits）到 Pro $20/月（1000 credits），Pro Max $100/月（5000 credits）。Agent Hooks（事件触发自动执行）是 Kiro 相对于 Cursor / Claude Code 的差异化能力。

已经在用 Amazon Q Developer 的团队：5 月 29 日已经是前沿模型访问的实际截止点，有依赖最新 Claude 模型的工作流应优先迁移。

PixelRAG：截图替代解析，Agent 检索成本降 10 倍

UC Berkeley / Princeton / EPFL / Databricks 联合研究团队本周发布 PixelRAG，思路是彻底绕开 HTML 解析：用 Playwright 渲染页面为截图，对 30M 张 Wikipedia 截图 tile 建索引，用视觉语言模型（Qwen3-VL-Embedding-2B，FAISS 近似近邻）检索，再用 VLM reader 直接从图像读取答案。6

在 SimpleQA 上的准确率：PixelRAG 78.8% vs 最强文本解析方案 71.6%；结构化表格查询：48.8% vs 42.5%。在 6 项 benchmark 上全部优于文本基线。

チャートを読み込んでいます…

对 Agent token 成本更直接：同等任务下 PixelRAG 用了 360 万 prompt token，而文本检索方案消耗 3750 万——成本差约 10 倍，加图像压缩后可再降 1/3。弱点是固定像素高度切片导致的「视觉块边界」问题，中间切断表格或段落还没有好的解决方案。

需要 Qwen3-VL-4B 以上的模型才能看到效果（更小的模型落后文本基线 12.5 个百分点以上）。目前最实用的部署路径是 PixelRAG 作为现有文本 RAG 的补充层，而不是完整替换。代码已在 GitHub 开源。6

Altman、Amodei、Hassabis 将同赴 G7 峰会

G7 峰会将于 6 月 15-17 日在法国 Évian-les-Bains 举行。OpenAI Sam Altman、Anthropic Dario Amodei、Google DeepMind Demis Hassabis 三人同时出席——法国总统马克龙亲自邀请 Altman 参与「领导人级别对话」。7

三家公司都确认出席但未透露具体议程。时机敏感：Anthropic 6 月 1 日已秘密提交 S-1（目标估值 $9650 亿），OpenAI 6 月 8 日跟进，两家可能在 2026 年 Q3/Q4 先后上市。两家公司 IPO 窗口期正在对监管者和机构投资者讲同一个故事：AI 实验室愿意主动接受治理框架。

G7 已通过 Hiroshima AI Process（2023 年）建立了 AI 监管原则和行为准则，但目前都是自愿性框架。Évian 峰会是否会推出具有约束力的机制，将影响后续监管走向。

补充：Anthropic Q2 营收 $109 亿，首季盈利；Zscaler 发布 AI Agent 安全平台

Anthropic 预计 Q2 2026 营收 $109 亿，较 Q1 $48 亿翻超一倍，也超过公司 2025 全年营收总和。这将是公司成立五年来首个收支平衡季度，年化 run rate 达 $470 亿。驱动来源约 85% 为企业 API 用量，核心是 Claude Code 和 Opus 4.8。年化 $470 亿的 run rate 在 Anthropic 的 S-1 路演中将是核心数据。8

Zscaler 在 Zenith Live 2026 上发布了面向 AI Agent 的安全控制平面：AI Broker（拦截和检查 Agent 与外部 LLM 服务之间的流量）、AI Access Graph（可视化 Agent 的工具访问和数据流路径）、以及 ZAgent Framework（将 Zero Trust 策略自动化嵌入 SASE 编排）。9 随着企业 Agent 快速进入生产环境，这类「AI Agent 安全可观测性」工具会越来越重要——目前该领域竞争者还不多。

本期覆盖时段：2026-06-12（部分新闻的实际发生时间为 6 月 11 日，文中已注明）