AI Agent 生态速报 | 2026-06-12:OpenAI 收购 Ona 给 Codex 装上云端大脑,Visa 为 Agent 开通支付,Google WebMCP 标准起步

AI Agent 生态速报 | 2026-06-12:OpenAI 收购 Ona 给 Codex 装上云端大脑,Visa 为 Agent 开通支付,Google WebMCP 标准起步

OpenAI 收购前 Gitpod 公司 Ona,Codex 5M 周活用户将获得持久云端沙箱执行环境,直接对标 Claude Fable 5 的长任务优势;Visa 与 OpenAI 合作将支付网络嵌入 AI Agent;Google WebMCP 在 Chrome 149 开放原始试验,让网页可直接声明 Agent 工具;AWS Kiro 替代 Amazon Q Developer;PixelRAG 让 RAG 检索成本降 10 倍。

Agent 生态周报
2026/6/13 · 10:09
購読 1 件 · コンテンツ 53 件

リサーチノート

今天发生的事情,很多值得记下来。OpenAI 用一笔收购给 Codex 装上了「云端大脑」;Visa 直接把支付轨道接入 AI Agent;Google 在浏览器里动了根本,WebMCP 让每个网页都能变成 Agent 的工具;AWS 的新 IDE 正式宣告了 Amazon Q 的退出;连 Anthropic 也首次要盈利了。以下是 2026 年 6 月 12 日 AI Agent 生态的核心动态。

OpenAI 收购 Ona,Codex 终于有了「家」

OpenAI 于 6 月 11 日宣布将收购 Ona(前身为 Gitpod),这家初创公司提供安全预配置的云端沙箱,让 AI Agent 在用户关掉电脑后仍能持续运行。Ona 现有约 200 万开发者用户,收购条款未披露,Ona CEO Johannes Landgraf 及团队将加入 Codex 部门。1
Ona 解决的是 Codex 架构上最明显的短板:任务中断。当前 Codex Agent 在会话超时或设备关机时就会丢失上下文和工具连接。Ona 提供的云端工作空间保持持久在线,沙箱可在任务结束后自动销毁,同时内置了基于哈希的应用阻断和凭证隔离,防止 Agent 意外暴露敏感数据。2
收购时机很说明问题。此前一天 OpenAI 透露 Codex 已超过 500 万周活用户(4 月时为 300 万),面对 Claude Fable 5 在长任务 benchmark 上的显著领先,OpenAI 需要一个基础设施层面的答案。Ona 集成后,Codex 将能处理数天跨度的代码迁移、多系统集成等任务,而不必每隔几小时重新加载上下文。
这是 OpenAI 2026 年完成的第六笔收购,节奏明显快于 2025 年全年的八笔。
統計カードを読み込んでいます…

Visa × OpenAI:Agent 拿到了信用卡

6 月 10 日,Visa 与 OpenAI 在旧金山支付论坛上宣布战略合作。核心是:Visa 的支付网络、Token 化凭证和欺诈监控基础设施将直接嵌入 OpenAI 产品,允许 AI Agent 在用户设定的规则和商户范围内自主完成购买。3
Visa CPO Jack Forestell 原话:「AI 对商业的改变将深过互联网或移动互联网。」
这与 OpenAI 今年 3 月叫停的 Instant Checkout 功能在架构上有根本区别:Instant Checkout 试图自建结账层,最终因税务合规问题失败且商户寥寥;Visa 合作直接复用每年处理 15 万亿美元交易的现有轨道,责任边界更清晰。技术已经就绪,剩下的挑战在于消费者是否愿意让 Agent 真的「刷卡」。
对于在 Agent 工作流中集成支付环节的开发者来说,这个合作预示着 OpenAI API 侧会出现官方支持的支付接口,具体接入文档尚未发布,需跟踪 OpenAI 开发者公告。

Google WebMCP:网页变成 Agent 的工具

Chrome 149 在 6 月 12 日开放了 WebMCP 的 Origin Trial,这是 Google 与 Microsoft 在 W3C Web ML 社区组共同推进的新 Web 标准草案。4
WebMCP 让开发者用两种方式把网站功能暴露给浏览器内 Agent:
  • 命令式 API:注册带类型参数和 handler 函数的 JavaScript 工具,Agent 直接调用,无需截图或解析 DOM。
  • 声明式 API:给现有 HTML 表单加注释,低改造成本适合大多数已有表单的网站。
这解决了浏览器 Agent 长期依赖「截图 → 猜测元素 → 点击」的脆弱链路。Expedia、Booking.com、Shopify、Credit Karma、TurboTax、Instacart、Target 等已在试验。
WebMCP 在协议栈里的定位是「Agent 访问网站」,与 MCP(Agent 访问基础设施)和 A2A(Agent 间协作)互补而非替代。对构建浏览器自动化或 Web Scraping 场景的开发者,这个标准值得关注:Origin Trial 期间不建议生产部署,但安全模型仍在明确中。
WebMCP 三层协议栈示意:MCP(基础设施)/ A2A(Agent 协作)/ WebMCP(网站工具化)
WebMCP 在 Agent 协议栈中的位置 4

AWS Kiro 上线,Amazon Q Developer 进入退场倒计时

AWS 于 5 月 7 日国际发布了 Kiro,这是 Amazon Q Developer IDE 插件的地基级替代品,不是功能更新。5
Kiro 的核心机制是「规格驱动开发」:用户输入需求后,IDE 先把它转化为 EARS 格式的正式需求文档,再生成架构设计和任务序列,然后才开始写代码。这个流程在工具层面让「跳过规格直接 vibe-code」变得困难。每个功能点会自动生成可追溯的需求文档,合规审计时不必事后补写。
Kiro 的关键时间节点:
日期变化
2026-05-15Amazon Q Developer 停止新用户注册
2026-05-29Claude Opus 4.6+ 独占 Kiro,Q Developer 停留在 Opus 4.5
2027-04-30Amazon Q Developer IDE 插件全面停止支持
Kiro 底层跑 Amazon Bedrock,在任务类型间自动路由 Claude Sonnet 4.5(推理/规格生成)和 Amazon Nova(高吞吐代码生成)。定价从免费(50 credits)到 Pro $20/月(1000 credits),Pro Max $100/月(5000 credits)。Agent Hooks(事件触发自动执行)是 Kiro 相对于 Cursor / Claude Code 的差异化能力。
已经在用 Amazon Q Developer 的团队:5 月 29 日已经是前沿模型访问的实际截止点,有依赖最新 Claude 模型的工作流应优先迁移。

PixelRAG:截图替代解析,Agent 检索成本降 10 倍

UC Berkeley / Princeton / EPFL / Databricks 联合研究团队本周发布 PixelRAG,思路是彻底绕开 HTML 解析:用 Playwright 渲染页面为截图,对 30M 张 Wikipedia 截图 tile 建索引,用视觉语言模型(Qwen3-VL-Embedding-2B,FAISS 近似近邻)检索,再用 VLM reader 直接从图像读取答案。6
在 SimpleQA 上的准确率:PixelRAG 78.8% vs 最强文本解析方案 71.6%;结构化表格查询:48.8% vs 42.5%。在 6 项 benchmark 上全部优于文本基线。
チャートを読み込んでいます…
对 Agent token 成本更直接:同等任务下 PixelRAG 用了 360 万 prompt token,而文本检索方案消耗 3750 万——成本差约 10 倍,加图像压缩后可再降 1/3。弱点是固定像素高度切片导致的「视觉块边界」问题,中间切断表格或段落还没有好的解决方案。
需要 Qwen3-VL-4B 以上的模型才能看到效果(更小的模型落后文本基线 12.5 个百分点以上)。目前最实用的部署路径是 PixelRAG 作为现有文本 RAG 的补充层,而不是完整替换。代码已在 GitHub 开源。6

Altman、Amodei、Hassabis 将同赴 G7 峰会

G7 峰会将于 6 月 15-17 日在法国 Évian-les-Bains 举行。OpenAI Sam Altman、Anthropic Dario Amodei、Google DeepMind Demis Hassabis 三人同时出席——法国总统马克龙亲自邀请 Altman 参与「领导人级别对话」。7
三家公司都确认出席但未透露具体议程。时机敏感:Anthropic 6 月 1 日已秘密提交 S-1(目标估值 $9650 亿),OpenAI 6 月 8 日跟进,两家可能在 2026 年 Q3/Q4 先后上市。两家公司 IPO 窗口期正在对监管者和机构投资者讲同一个故事:AI 实验室愿意主动接受治理框架。
G7 已通过 Hiroshima AI Process(2023 年)建立了 AI 监管原则和行为准则,但目前都是自愿性框架。Évian 峰会是否会推出具有约束力的机制,将影响后续监管走向。

补充:Anthropic Q2 营收 $109 亿,首季盈利;Zscaler 发布 AI Agent 安全平台

Anthropic 预计 Q2 2026 营收 $109 亿,较 Q1 $48 亿翻超一倍,也超过公司 2025 全年营收总和。这将是公司成立五年来首个收支平衡季度,年化 run rate 达 $470 亿。驱动来源约 85% 为企业 API 用量,核心是 Claude Code 和 Opus 4.8。年化 $470 亿的 run rate 在 Anthropic 的 S-1 路演中将是核心数据。8
Zscaler 在 Zenith Live 2026 上发布了面向 AI Agent 的安全控制平面:AI Broker(拦截和检查 Agent 与外部 LLM 服务之间的流量)、AI Access Graph(可视化 Agent 的工具访问和数据流路径)、以及 ZAgent Framework(将 Zero Trust 策略自动化嵌入 SASE 编排)。9 随着企业 Agent 快速进入生产环境,这类「AI Agent 安全可观测性」工具会越来越重要——目前该领域竞争者还不多。

本期覆盖时段:2026-06-12(部分新闻的实际发生时间为 6 月 11 日,文中已注明)

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。