AI Agent 生态速报 | 2026-05-16：Gemini Spark 四重验证，Agent 记忆赛道 7 项目同时爆发

采集窗口：2026-05-15 03:19 — 2026-05-16 02:00（UTC+8）｜约 22 小时（略短于正常日报周期）｜核心信号数：20 条

本期概览

本期覆盖 5/15 至 5/16 早间动态，采集窗口约 22 小时，比日常周期略短。

三条主线值得重点关注。第一，Gemini Spark 泄露量级升级：从单一 APK 截图变成四家媒体交叉验证、隐私声明文本逐字核对，Google I/O（5/19-20）前夕确认度已达上限。第二，Agent 记忆赛道在 GitHub 集中爆发，7 个项目同期涌现，字节跳动（OpenViking）、腾讯（TencentDB-Agent-Memory）两家大厂同时开牌入场。第三，AG-UI 协议的采用状态需要一次重要修正：四大云厂商（Microsoft / Google / Oracle / AWS）均已采用，此前记录「仅 MS Agent Framework」有误。

一、Gemini Spark：Google I/O 前夕最大泄露

四重交叉验证

Gemini Spark 并非首次露面——5/15 期本栏已报道过 web app 的 BETA 截图。但本窗口内的信息量级明显不同：9to5Google 以 APK Insight 形式从 Google app beta 17.23 提取了完整 onboarding 文本1；Android Authority 发布了包含 Skills 创建 UI 的截图集2；FindSkill.ai 对 onboarding 文本做了逐字分析3；Digital Trends 跟进了桌面端 UI 截图4。四路交叉，内部编号从「Gemini Agent」更名为「Gemini Spark」的事实已无争议。

Gemini Spark 欢迎界面：「What can I get done for you today?」，预设任务含清理收件箱、获取会议摘要、自定义新闻摘要

图片来自：Gemini's Spark agent has leaked

功能细节

Spark 定位为 24/7 全天候 AI agent，内置在 Gemini 应用中，不是独立产品1。通过 Gemini 启动器左侧汉堡菜单激活，双模式设计：Agent Mode（自主执行任务）+ Chat Mode（传统对话），带「advanced tool use」2。

接入的数据源包括 Gmail/收件箱、Calendar、Tasks、登录的网站、位置、Connected Apps、Personal Intelligence；Google Drive 未直接命名，但 Android Authority 认为极可能包含3。

Skills 创建是本轮泄露里最值得关注的设计细节。Create Skill 界面包含 Title、Description、Instructions 三个字段，模式与 Anthropic Claude 的 Skill API 高度相似，但目前不支持直接导入 skill.md 文件，仅支持复制粘贴2。

Gemini Spark Create Skill 界面：Title / Description / Instructions 三字段

图片来自：Gemini's Spark agent has leaked

那条隐私声明

onboarding 文本中有一段话吸引了最多讨论。9to5Google 引用的原文：

"While it is designed to ask for your permission before taking sensitive actions, it may do things like share your info or make purchases without asking."
「尽管 Spark 设计上会在执行敏感操作前向您确认，但它可能会在未经询问的情况下分享您的信息或进行购买。」
——Google Gemini Spark onboarding 文本1

FindSkill.ai 的解读是：这不是模板措辞，是一个真实警告3。不是「经您确认后执行」，也不是「始终需要许可」，而是明确告知 agent 可能绕过确认步骤。对于做 agent 产品权限设计的团队来说，这条措辞值得作为参照——Google 选择了「告知 + 放行」而非「默认限制」。

定价与上线：据报道，Spark 将作为 Google AI Pro tier（$19.99/月）独占功能3，Pixel 设备首发，EU 因 AI Act 对消费者 agent 透明度要求（2026 年 8 月 2 日生效）预计延迟上线2。以上均为泄露信息，Google DeepMind 尚未做任何官方确认，5/19 I/O keynote 是验证节点。

Gemini Flash 商业渗透（Vercel 数据）

与 Spark 同期有一组商业数据值得关注。Business Insider 援引 Vercel AI Gateway 数据：按 token 使用量，Gemini 3 Flash 于 2026 年 4 月初超越 Anthropic 并保持领先；但按金额计算，Anthropic 仍占 61%，Google 从 8% 升至 21%，OpenAI 从 4% 升至 12%5。

Vercel CEO Guillermo Rauch 的解释是：Flash 在 B2C 场景受欢迎因为它「doesn't hallucinate much, uses tools effectively, and it's fast and affordable」5。token 量领先但金额落后，说明 Flash 主导的是高频低价调用场景——这和 Spark 的 24/7 always-on 定位完全一致：薄利高量跑量。

Gemini 3.5 Flash benchmark（单信源，参考）

LMArena 上出现名为「Gemini 3 Flash」的新 checkpoint，YouTube 创作者 Universe of AI 报告称其在人类偏好排名（arena 对战）中据称优于 Gemini 3.1 Pro 和 Claude Opus 4.76。该信源仅为 YouTube 频道转述，无 Google DeepMind 官方确认，排名反映人类偏好而非原始推理能力。Universe of AI 本人也说：「Arena is a vibes benchmark. It measures human preference in head-to-head matchups, not raw capability.」6 此条存在 prompt adherence 问题（测试者多次要求不使用搜索，模型仍继续使用）。等 I/O 官方发布后再做正式评估。

二、AG-UI 协议：四大云厂商全部采用

AG-UI（Agent-User Interaction Protocol）的采用状态需要一次修正。此前记录「仅 MS Agent Framework 支持」有误，实际是 Google / Amazon / Oracle / Microsoft 四家均已采用7：

Microsoft（2025 年 11 月）：Agent Framework 与 AG-UI 完全兼容，通过 CopilotKit 桥接 agent 后端与前端
Google（2025 年 12 月）：A2UI 规范通过 AG-UI 协议与 CopilotKit 集成，支持 Generative UI
Oracle（2025 年 12 月）：Open Agent Specification 采用 AG-UI 协议
AWS（2026 年 3 月）：AgentCore 推出专用 AG-UI 端点 + FAST template 模式用于全栈 agent 构建

CopilotKit 是 AG-UI 协议的主要推动者，GitHub 上 AG-UI Protocol 已有 12K+ stars7。

AG-UI 仍处于 RC（Release Candidate）阶段，MS Agent Framework python-1.4.0 release notes 明确标注「Promote to release candidate stage #5844」，尚未发布 GA 正式版8。对于正在做多框架前端集成的团队，AG-UI 已是事实标准，但生产选型需等 GA。

三、开源框架快讯

本窗口内（约 22 小时）有三个框架发布了新版本，其余主流框架无更新。

OpenClaw 2026.5.16-beta.1 是本轮最大更新，共 44 项变更（4 项新特性 + 40 项修复）9。4 项新特性：CLI 设置向导支持英语/简体中文/繁体中文本地化（PR #80645，@GaosCode）；活跃网关轮次中缓存已加载技能，避免冗余重建（PR #81451，@solodmd）；Telegram 群聊新增可选 ambientTurns 模式（PR #81317，@obviyus）；Codex MCP 服务器可限定到特定 agent ID 并支持原生默认审批策略（PR #82180，@sercada）。修复覆盖 Telegram / Discord / LINE 渠道稳定性、OpenRouter DeepSeek V4 兼容、macOS 更新死循环、TTS 语音投递、Cron 隔离运行等9。OpenClaw 当前 372k stars，约 2 天一个 beta 版本。

LangChain 1.3.1 为小型补丁，2 项变更：release 工程 bump 和修复 Bedrock provider 在摘要 token 检查中的别名问题10。无 breaking changes，无新特性，可直接升级。

CrewAI 1.14.5a6 为 alpha 预发布补丁，3 项修复：streamed tool calls 在 available_functions 缺失时的处理；langsmith 依赖升级至 >=0.8.0 以解决安全公告 GHSA-3644-q5cj-c5c7；巴西葡萄牙语文档中未翻译的代码块占位符11。正式版仍为 1.14.4（2026-04-30）。使用 langsmith 的项目注意安全依赖升级。

Semantic Kernel → MS Agent Framework 迁移：README 已正式声明 MS Agent Framework 为后继项目，迁移指南地址已上线（[https://learn.[microsoft.com/en-us/agent-framework/migration-guide/from-semantic-kernel](https://learn.microsoft.com/en-us/agent-framework/migration-guide/from-semantic-kernel)](https://microsoft.com/en-us/agent-framework/migration-guide/from-semantic-kernel](https://learn.microsoft.com/en-us/agent-framework/migration-guide/from-semantic-kernel))）12。SK 后续维护节奏可预期趋于保守。

窗口内无新版本：LangGraph 1.2.0 / Dify v1.14.1 / LlamaIndex v0.14.22 / MS Agent Framework python-1.4.0 / AutoGen v0.7.5（停滞于 2025-09-30）13。

四、GitHub 趋势——Agent 记忆赛道集中爆发

过去一周，GitHub Trending 上 AI Agent 记忆赛道出现了明显的集聚信号：至少 7 个独立项目同时获得关注，字节跳动和腾讯先后开牌，从图数据库到 Git 版本控制，各种底层设计路线都有项目覆盖。

字节跳动 OpenViking：文件系统范式替代扁平向量存储

volcengine/OpenViking 是火山引擎开源的 Agent 上下文数据库（Context Database），当前 24k stars、1.8k forks，Rust 主体实现，AGPLv3 授权14。

核心设计是「文件系统范式」：用统一的 viking:// URI 协议管理记忆/资源/技能，L0/L1/L2 三层按需加载——Abstract（约 100 tokens）→ Overview（约 2k tokens）→ Details（完整）。检索路径：意图分析 → 向量定位 → 精化探索 → 递归下钻 → 结果聚合。

在 OpenClaw 基准上，接入 OpenViking 后任务完成率从 35.65% 升至 52.08%（+46%），输入 token 成本从 2461 万降至 426 万（-83%）14。支持 Volcengine / OpenAI / Kimi / GLM / OpenAI Codex 等多种 provider。

腾讯 TencentDB-Agent-Memory：符号化短期记忆 + 分层长期记忆

Tencent/TencentDB-Agent-Memory 是腾讯最新开源的 Agent 记忆系统，1.9k stars，TypeScript 实现，MIT 授权15。

核心技术两点：符号化短期记忆——将繁重的工具调用日志压缩为 Mermaid 符号；分层长期记忆——persona（用户偏好）+ scene（场景上下文）分层管理，拒绝扁平向量存储。

基准数据：OpenClaw WideSearch 上 token 降低 61.38%（2.21 亿 → 0.86 亿），任务通过率从 33% 升至 50%（+51.5%）；SWE-bench token 降低 33%，通过率从 58.4% 升至 64.2%；PersonaMem 长期记忆准确率从 48% 升至 76%15。

社区项目矩阵

除两家大厂外，社区同期涌现了多个独立项目：

项目	Stars	核心方案	授权
gastownhall/beads	23.7k	Dolt（一个支持版本控制的 SQL 数据库）图数据库，hash-based IDs 防合并冲突，v1.0.4	MIT
Gentleman-Programming/engram	3.5k	Go + SQLite + FTS5，零依赖单二进制，19 个 MCP 工具，v1.15.13	MIT
matrixorigin/Memoria	267	Copy-on-Write 引擎（写时复制，修改不影响原有版本），零拷贝分支 + 即时快照，「Git for Agent Memory」，有 arxiv 论文	Apache 2.0
opendev-to/opendev	590	Rust 终端 coding agent，4.3ms 启动，Compound AI 架构（多个子 agent 各自独立绑定不同模型，而非单一 LLM 兜底）	MIT

来源：16 17 18 19

持续追踪项：agentmemory（rohitg00）当前 9.7k stars，较窗口前约 +700，增速有所放缓20。

选型参考：OpenViking 和 TencentDB-Agent-Memory 都有大厂背书和量化基准，优先考虑有持续维护预期的场景；beads 和 engram 更轻量，适合小团队快速接入；Memoria 的 Git 范式适合需要记忆版本管理和回滚能力的长期任务 agent。所有项目均已支持 MCP 协议，可接入 Claude Code / Cursor / Codex 等主流工具链。

五、Musk v Altman：陪审团 5/18（非 5/19）开始审议

补充上一期的一个日期修正：9 人咨询陪审团（6 女 3 男）将于 **5 月 18 日（周一）**8:30 AM PT 开始审议21，而非 5/19。

MIT Technology Review 援引 Northwestern 法学教授、非营利法学者 Jill Horwitz 的评论：「The public interest in the nonprofit loses, no matter who wins or loses this trial.」21 裁决为咨询性质（advisory verdict），对法官 Yvonne Gonzalez Rogers 不具约束力，法官做最终责任认定。

Musk 方律师 Steven Molo 结案陈词中用了一个木桥比喻，对陪审团说：「Imagine that you're on a hike, and you come upon one of those wooden bridges...A woman standing by the entry to the bridge says, 'Don't worry—the bridge is built on Sam Altman's version of the truth.' Would you walk across that bridge?」21

（「想象你在徒步，来到一座横跨峡谷的木桥。桥口站着一个女人说：『别担心，这桥建立在 Sam Altman 版本的真相上。』你会走过去吗？」）

OpenAI 方律师 Sarah Eddy 反驳，称 Musk「never cared about the nonprofit structure. What he cared about was winning.」21（「他从来不在乎非营利结构，他在乎的是赢。」）

Musk 5/15 全天约 20 条推文（含转发），主题为 Nolan's Odyssey 电影、DEI/奥斯卡、X 平台、Starlink，无一涉及 AI 或庭审22。诉讼时效是陪审团审议的首要判断点：若 Musk 超过起诉窗口，法官极可能直接判被告胜诉。

六、社区讨论——熵管理是生产 Agent 头号门槛

r/AI_Agents 本窗口内最高赞帖子来自 u/Multicolorlion，标题直接：「production agents don't break because they're dumb. they break because nobody manages the entropy.」23

帖主在生产环境运行 agent 数月后总结：

"it's rarely the reasoning that breaks. the model is fine. the logic is fine. what fails is everything underneath it. stale sessions, conflicting memory, half-finished tasks from three days ago, an expired token"
「推理逻辑很少是崩溃点。模型没问题，逻辑也没问题。出问题的是底层的所有东西——过期的会话、冲突的记忆、三天前没完成的任务、一个到期的 token。」
——u/Multicolorlion23

评论区 u/Professional_Log7737 补充了一个更具体的操作建议：「The operational failure mode I keep seeing is silent state drift between steps. A small verification check after each tool action usually saves more pain than adding another planner layer.」23（「我反复看到的失败模式是步骤间无声的状态漂移。每次工具调用后加一个小的验证检查，比再加一层 planner 更能省麻烦。」）

这个社区共识和本期第四章的项目爆发直接呼应——大厂和社区在同一周冲向记忆赛道，不是因为技术突破，而是因为生产化压力已经积累到一个临界点。

值得追踪

Google I/O 2026（5/19-20）：Gemini Spark 是否正式发布、Skills API 是否对第三方开放、Gemini 3.5 Flash 是否官方确认1
5/18 陪审团审议：诉讼时效判断是首要问题，法官接受陪审团意见与否的处置方式是次要节点21
AG-UI 转正：MS Agent Framework 下一个版本是否将 AG-UI 从 RC 升为 GA，以及四厂采用后是否推动正式协议规范发布8
Agent 记忆赛道整合：OpenViking 和 TencentDB-Agent-Memory 是否进入主流框架（LangChain / LangGraph / OpenClaw）官方集成14

封面图：未来感数字处理器（Pachon in Motion，Pexels 免版权）