AI Agent 生态速报 | 2026-05-18:Musk v Altman 今日陪审,Google I/O 明日开幕,记忆赛道三项目集体消失

本期覆盖 5/16 下午至 5/18 凌晨约 47.5 小时动态。三条主线:(1)Musk v Altman 陪审团今日 PDT 上午正式启动审议,TechCrunch/Guardian/NBC/WIRED 四路深度分析指向同一核心问题——「信任」,庭审暴露了多位前高管对 Altman 的指证及整个 AI 行业的透明度困境;(2)Google I/O 前夜,Forbes APK 代码拆解揭示 Gemini Intelligence 底层三件套(`agent_schedules` 定时调度器、`agent_skills` 技能系统、后台常驻服务),Pixel 9 系列因 Nano v2 硬件门槛被排除,明日 Keynote 是验证节点;(3)上期追踪的 agentmemory(9.7k★)、Memoria、TencentDB-Agent-Memory 三个记忆赛道项目在本窗口全部返回 GitHub 404,去向未明。

研究速览

采集窗口:2026-05-16 10:38 — 2026-05-18 02:00(UTC+8)|约 47.5 小时(较常规日报略长,请注意部分事件发生于 5/16 下午至 5/17)|核心信号数:22 条

本期窗口压在两个高密度节点之间:今日(5/18)Musk v Altman 九人陪审团正式开始审议;明日(5/19)Google I/O 2026 开幕。市场在等结果,厂商在做最后预热。三条主线值得优先关注:
  1. 审判进入决策阶段:陪审团今日 PDT 上午启动审议,TechCrunch/Guardian/NBC/WIRED 在窗口内集中输出了三周庭审的深度分析,「信任」是核心关键词
  2. Gemini Intelligence 架构级曝光:Forbes APK 拆解从功能截图升级到底层代码字符串,定时调度器、技能系统、后台常驻服务全部浮出水面
  3. 记忆赛道出现整合信号:agentmemory(9.7k★)、Memoria、TencentDB-Agent-Memory 三个窗口内追踪项目同时返回 404

一、Musk v Altman:今日审议,三周庭审留下什么

真空期确认

陪审团审议定于 5/18 周一 PDT 上午在奥克兰联邦法院启动1。截至本期采集截止(5/18 02:00 CST),尚在周日 PDT,无任何裁决或审议进展消息2
Musk 在窗口内(5/16-5/18 PDT)发布了约 19 条推文,主题涵盖 Grok 升级(「Grok upgrades」「Grok Build is improving like lightning」)、Starship V3 和政治转发,零条涉及 trial、OpenAI 或 Altman3
法官 Yvonne Gonzalez Rogers 同日安排了听证会,在陪审团就责任问题审议的同时,开始平行考虑救济方案2。若陪审团裁定 OpenAI 负有责任,Musk 寻求的救济包括:永久禁令以恢复原始章程承诺、罢免 Altman 和 Brockman,潜在索赔可达 1500 亿美元。

信任问题

窗口内最值得读的分析来自 TechCrunch 5/17 的庭审深度文章,三位记者对最后几天的法庭感受坦率得少见1
核心争议点:Musk 律师 Steve Molo 在交叉质询中就 Altman 在国会证词中声称「未持有 OpenAI 股权」进行追问——Altman 实际上通过其曾任负责人的 Y Combinator 间接持有。Altman 的回应是「我假设所有人都知道作为 VC 基金的被动投资者意味着什么」,Molo 反击:「你真的认为采访你的国会议员知道这个?」1
TechCrunch 记者 Kirsten Korosec 对这场审判的判断直接点出了更大的结构问题:
"This is a fundamental question for a lot of tech journalists, policymakers, and more and more consumers, about all the AI labs. It's really come down to trust, because we don't have the insight, necessarily — these are all privately held companies, there's a lot behind the veil still."
「对于很多科技记者、政策制定者,以及越来越多的普通消费者来说,这是针对所有 AI 实验室的根本性追问。归根结底是信任问题——我们并不一定拥有真正的洞察力,这些都是私有公司,帷幕后面还有很多。」
1

三周庭审留下什么

Guardian 5/16 梳理了整个审判最具揭示性的五个节点4:前 CTO Mira Murati 作证称 Altman「对一个人说一套,对另一个人完全相反」;前董事 Natasha McCauley 指控 Altman 制造「反复的危机事件」;联合创始人 Ilya Sutskever 在被问及 Altman 是否「表现出持续的说谎模式」时回答:「Yes.」;Satya Nadella 将 2023 年政变称为「业余城市」(amateur city);Brockman 个人日记作为证据被提交,其中包含「财务上,什么能让我达到 10 亿美元?」4
至于谁会赢——WIRED 专栏作者的回答更值得关注:Northwestern 法学教授 Jill Horwitz 指出,「这很难看出哪一方在保护公共利益。」前 OpenAI 研究员 Daniel Kokotajlo 则说得更直接:「Musk 和 Altman 基本上陷入了一场率先构建超级智能的竞赛,他们双方都正确地害怕对方获胜后会做什么。我们其他人应该害怕他们两个。」5
NBC News 的旁观者视角:法庭外,抗议者设置了 Musk 和 Altman 出气筒、15 英尺高的充气 Musk 娃娃,一名来自洛杉矶的抗议者头戴 Musk 面具、身披纸板 Cybertruck,举着标有「ketamine」字样的袋子,表示「我认为一个亿万富翁不可能以合乎道德的方式获得财富」2。法官 Gonzalez Rogers 将整个审判总结为三个字:「Billionaires versus billionaires.」2

二、Google I/O 前夕——Gemini Intelligence 架构深度曝光

手机屏幕显示 Gemini 渐变标识,背景为蓝色电路板图案
手机屏幕显示 Gemini 渐变标识,背景为蓝色电路板图案
上期已报道 Gemini Spark 的四重 APK 功能验证(Skills UI、隐私声明、Pro tier 定价)。本期 Forbes 资深撰稿人 Paul Monckton 对 Google App v17.20 的代码拆解把分析层级推进了一步——从「这个功能存在」到「这个系统怎么建的」6

底层三件套

代码中出现了三个关键字符串6
  • agent_schedules:Gemini agent 将支持定时任务调度,不再仅限于按需响应。典型用例:「每天早上监测机票价格,降价时通知我」。这意味着 agent 持续运行在用户的任务队列里,而非每次唤醒后从零开始。
  • agent_skills:独立的技能系统已就位,agent 可通过模块化技能扩展能力,类似 mini-app 概念。
  • ROBIN_AGENT_MODE_FG_SERVICE:后台常驻前景服务(Foreground Service),使 agent 可以像导航或音乐播放一样持续在后台运行。
两个互补子系统分工明确:Robin(语音 agent,兼容旧款 Pixel)和 Bonobo(屏幕控制 agent,需 Android 16+),各自独立评估硬件资格6

硬件门槛

Gemini Intelligence 对设备要求异常严格:Nano v3 以上端侧 AI 模型、12GB+ RAM、旗舰 SoC,并需通过 Android 17+ 测试套件6。结果是:Pixel 9 系列因搭载 Nano v2 被排除在外。当前兼容设备为 Pixel 10 系列、Galaxy S26 系列、OnePlus 15 等旗舰。
对产品团队的含义:Google 用 Gemini Intelligence 做了一次明确的分层——普通用户用 Gemini App(云端推理),重度 agent 用户需要购买新旗舰。这和 Apple Intelligence 要求 iPhone 15 Pro 以上的策略如出一辙。

Gemini App 同期推送

9to5Google 5/17 报道:Gemini App 正在向部分用户推送「Thinking level」选项(Standard / Extended 可选),适用于 Gemini 3 Flash(Fast)和 Gemini 3.1 Pro7。同期,@Canva(设计协作)、@Instacart(生鲜购物)、@OpenTable(餐厅预订)三种第三方应用集成正在准备中7

I/O 2026 明日开幕

Google I/O 2026 将于 5/19 10:00 PT 开幕,Developer Keynote 于同日 13:30 PT 举行8。窗口内各方媒体发布的期待清单集中在:Gemini 大版本更新(可能为 Gemini 4 或 3.5 系列)、Android XR 智能眼镜正式发布(Gentle Monster/Warby Parker 合作款)、Aluminum OS(Android 桌面系统)开发者预览、「Remy」主动式 AI Agent(代号取自《料理鼠王》主角,与 Gemini Spark 存在关联)89

三、编码 Agent 赛道——Copilot 全线更新,Grok Build 入场

GitHub Copilot 三波密集发布

GitHub Copilot App Autopilot 界面,侧边会话栏与 PR 详情并排展示
GitHub Copilot App Autopilot 界面,侧边会话栏与 PR 详情并排展示
GitHub 在 5/13-5/15 集中发布了三波更新,覆盖从桌面到 IDE 再到评估体系:
Copilot App 桌面原生应用(5/14 技术预览)10:支持从 Issue、PR 或 prompt 启动会话,可暂停恢复,Agent Merge 功能自动处理 review 反馈并完成合并。这是 GitHub 将 agent 工作流原生化到桌面端的第一步。
JetBrains IDE Copilot CLI Agent(5/13 公开预览)11:两种隔离模式——Worktree isolation(独立 Git worktree 防主干污染)和 Workspace isolation(更彻底的环境隔离)。新增统一会话视图,可追踪所有 agent 会话的状态、耗时和类型。Agent Mode 新增 Ask Question 工具,agent 可在任务执行中主动向用户提出澄清性问题。
VS Code Copilot Harness 架构公开(5/15)12:VS Code 团队首次公开 VSC-Bench 评估套件和一个关键判断:「The model is the engine. The harness is the car.」Harness 负责 context assembly(上下文组装)、tool exposure(工具暴露)、tool execution(工具执行)和 agent loop(执行循环)。VSC-Bench 散点图数据:GPT-5.5 在 46%-56% 解决率区间优于 GPT-5.4,但部分配置下额外的思考成本已超过收益12
「模型是引擎,Harness 是整车」这个判断对选型有直接意义:在多模型生态下,选错 harness 的成本比选错模型更高,因为 harness 替换要改整个集成层,模型替换只是换一个 API 端点。

Grok Build:xAI 进入编码 Agent 赛道

xAI 发布了 Grok Build 的早期 beta 版本,这是其首个 AI 编码 Agent13。产品形态为 CLI 命令行工具,通过 TUI(文本用户界面)交互、headless 脚本或 Agent Client Protocol 使用,功能包括 Plan viewer(项目架构规划)、Skills 系统和 Arena Mode。定位直接对标 Anthropic Claude Code、GitHub Copilot 和 Cursor13
目前一手来源(x.ai/news)因 HTTP 400 无法直接抓取,上述信息来自 PCMag 等二手报道,功能细节待 xAI 官方补充。现阶段仅适合观望。

四、开源框架——OpenClaw 三连发,Hermes v0.14.0

本窗口(47.5 小时)内有实质更新的框架只有两个,其余 13 个追踪项目均无新版本。

OpenClaw:beta.4 / beta.5 / beta.6 三连发

OpenClaw 在 5/17-5/18 连续发布三个预发布版本(v2026.5.16-beta.4、beta.5、beta.6),合计约 44 项 Changes 和 30+ 项 Fixes14。主要变更:
功能扩展:Mac App 重新设计设置页面,采用统一卡片布局;Skills 模块新增 meme-maker 技能(模板搜索 + 本地/云端渲染)、节点检查器调试技能、融合图生成技能、Python 调试技能(支持 pdb/breakpoint/debugpy);CLI/Plugins 新增 defineToolPlugin 命令,支持类型化简单工具插件的构建、验证和初始化工具链14
测试与安全:QA-Lab 新增不同时长运行一致性测试、live-only 测试场景、运行时工具夹具覆盖;新增 security.audit.suppressions 配置,允许有意接受的审计发现被抑制14
提供者与集成:新增 xAI Grok OAuth 登录、fal 和 OpenRouter 音乐生成提供者;修复 Gemini 3 工具调用特征保留问题;修复 Feishu、Telegram、WhatsApp、Slack、Gateway 跨通道 bug14
HN 上有一个有趣的争议:OpenClaw 创作者 Peter Steinberger(同时也是 OpenAI 员工)被曝 30 天内消耗相当于 130 万美元的 OpenAI API token,社区高度分裂——有人认为这是「预测 LLM 未来使用方式」的先行探索,有人讽刺「花一堆 token 让 50 个 agent 修了个 About 页面的拼写错误」,还有人指出实际成本受到内部员工权限的大幅补贴15

Hermes Agent v0.14.0:14 项关键变更

NousResearch(一家专注模型研究的 AI 公司)的 Hermes Agent 于 5/16 发布 v0.14.0,当前已积累 155k stars(+3k,窗口内增长)16。本次更新的核心变更:
  • 模型接入:新增 xAI SuperGrok OAuth 登录,Grok-4.3 升级至 100 万上下文窗口16
  • 工具扩展:新增原生 X(Twitter)搜索工具 x_search,支持 OAuth 或 API 密钥两种授权方式;完成 Microsoft Teams 全流程端到端适配(读取消息 + 回复)16
  • 分发方式:正式发布到 PyPI,可通过 pip install hermes-agent 安装16
  • 性能:浏览器 CDP 调用速度提升 180 倍;hermes 启动时间减少约 19 秒;新增跨会话 1 小时 Claude 提示缓存16
  • 平台扩展:新增 LINE、SimpleX Chat,支持平台总数达 22 个;/handoff 功能可完整实时转移活跃会话全部上下文16
自 v0.13.0 至本版本,项目累计 808 个提交、633 个 PR、215 位社区贡献者16
本窗口无更新的追踪项目:LangChain(最新 1.3.1,5/15)、LangGraph(最新 1.2.0,5/12)、Dify(最新 v1.14.1,5/12)、LlamaIndex(最新 v0.14.22,5/14)、MS Agent Framework(最新 python-1.4.0,5/15,AG-UI 集成仍为 RC 未升 GA)、Semantic Kernel、OpenAI Agents SDK、Cloudflare agents 等17

五、记忆赛道剧变——三项目同时 404

这是本期最值得关注的生态信号,也是最缺解释的一条。
上期(5/16)本栏还在追踪 agentmemory(rohitg00/agentmemory,上次 9.7k stars、+700/day)、Memoria(memoria-ai/memoria,CoW 引擎)、TencentDB-Agent-Memory(TencentCloud,1.9k stars)三个记忆赛道项目。截至 5/18,三者全部返回 GitHub 404,使用 fetchUrl 和 jinaReader 均无法访问181920
三种可能:仓库被删除、重命名迁移、或设为私有。三个项目在一个 47.5 小时窗口内同时消失,这不太可能是巧合。信息缺口此处真实存在——当前可见范围内无法确认三者的具体去向,下轮将补搜。
赛道内仍活跃的项目:Hermes Agent 155k(+3k)持续增长21;beads(gastownhall/beads)升至 23.8k(+100)22;engram(Gentleman-Programming/engram)升至 3.6k(+100)23;OpenViking(volcengine)维持 24k 持平24。增速趋缓的 beads 和 engram 对比上周仍保持正增长,但 +100 的日增量远低于两周前的水位。
Twitter 上 @Voxyz_ai 的 agent memory 四层分类法在窗口内获得较多讨论:recording(发生了什么)、lossless(恢复运行所需)、wiki(持续为真的事实)、query(行动前需要浮现的内容)25。这四层不是记忆实现方案,而是在问「你的 agent 需要记什么、在什么时机、为了什么目的」——这个提问框架比具体的实现技术更有参考价值。

六、GitHub Trending——新兴项目

本期 Trending 榜单涌现了 5 个 AI/Agent 相关新项目26
项目Stars日增语言定位
tinyhumansai/openhuman13,486+1,690Rust个人超级智能
tech-leads-club/agent-skills3,579+225TypeScript面向 AI coding agent 的安全验证 skill 注册表
colbymchenry/codegraph3,427+857TypeScript预索引代码知识图谱,减少 token 和 tool call
dograh-hq/dograh1,712+223Python开源语音 Agent 平台
Light-Heart-Labs/DreamServer1,203+112Python本地 AI 一体机(LLM+Chat+语音+Agent+RAG+图像生成)
codegraph 的思路值得单独看一眼——通过预索引代码知识图谱减少 agent 检索时的 token 消耗和工具调用次数,方向和 beads/engram 类似,但聚焦在代码库理解层而非通用 memory 层26
Simon Willison 5/14 的观察提供了一个配套视角:一家中型科技公司用 coding agent 将 iOS + Android 原生 App 全部重写为 React Native,选 React Native 的理由是「如果选错了,只要 port 回去就行」27。他引用 Mitchell Hashimoto 的话:「Programming languages used to be LOCK IN, and they're increasingly not so.」(「编程语言曾经意味着锁定,越来越不是这样了。」)27 不是技术层面的突破,而是工程决策逻辑在悄悄改写。

七、社区讨论——计费、治理、Agent vs Workflow

计费模型要变了

Reddit r/AI_Agents 本窗口内浏览量最高的帖子来自 u/o9dev,标题直接:「In 18 months, billing for AI agents will look like cloud infrastructure pricing」28
核心论点:agent 单次 action 的成本方差极大(简单查询约 $0.001,深度研究任务可到 $2.80),flat subscription 在规模化时结构性亏损——要么压低定价亏重度用户,要么加超额收费(overage)惹恼普通客户。u/o9dev 预测到 2026 年底,主导模型将是「按维度可变费率 + 实时消费追踪 + API 驱动计划变更」,接近 AWS 的定价逻辑28。评论区多数人认同这套技术逻辑,但认为「用户厌恶变额账单」是推行的现实阻力28

Agent vs Workflow:一个实用判别标准

另一个高热帖子的标题是「Most things people ship as 'agents' should be a workflow with one LLM call」29。最有用的判别标准来自评论区 u/Kindly_Leader4556:「The litmus test I use: can you draw the flowchart before you run it?」(「我用的判别标准:你能在运行前就画出流程图吗?」)——能画的是 workflow(确定性、可测试、可靠);不能画的才是 agent(用灵活性换可预测性和成本)29

生产环境的治理压力

「AI agents are fun until they start touching real data」30——帖主的问题:agent 开始接入多工具和真实公司数据后,logging 和审计成了真正的瓶颈。u/Cristiano1 的总结是:「问题不再是 AI 本身,而是没有干净的方式控制 agent 应该访问什么,或追踪它实际做了什么。」在受监管行业(如医疗 SaMD Class II),u/Virtual_Armadillo126 直接说推理路径每次不同的非确定性 agent 是「合规噩梦」31
同期,GitHub 推出了「Agentic AI Developer (beta)」认证,社区在讨论其含金量是否足够——目前评价尚未形成共识30
快讯补遗:Anthropic 的 Mythos 模型在一项安全研究中被用于协助研究人员绕过 Apple macOS 安全机制,结合权限提升漏洞,历时五天完成。Apple 表示正在审查。Google 安全研究员 Michał Zalewski 评价:「部分炒作言过其实,但用 Anthropic 工具进行有意义的漏洞研究和代码审计是可行的。」32 Voker.ai(YC S24)推出 AI Agent 分析平台,核心主张:90% 以上的 YC 创始人表示「唯一知道 agent 在生产中出问题的方式是客户投诉」33。基于 Intents/Corrections/Resolutions 三个原语自动标注对话,Free tier 2000 events/mo,$80/mo 起。

下期观察点

  1. Google I/O 5/19-20:Gemini Spark/4 正式发布状态、Android XR 眼镜发货时间、AG-UI 协议是否升 GA、ADK(Agent Development Kit)是否有重大更新9
  2. Musk v Altman 陪审结果:审议时长通常 1-3 天,最快 5/19 或 5/20 PDT 有初步结果;监控 Bloomberg/Reuters/NYT 推送1
  3. 三个 404 项目去向:agentmemory(9.7k★)、Memoria(CoW 引擎)、TencentDB-Agent-Memory(腾讯云)——是迁移、私有化还是彻底关停,下轮补搜18
  4. Grok Build 一手信息:xAI 官网当前无法抓取,PCMag 报道的功能细节待官方补充13

参考来源

  1. 1Why trust is a big question at the Elon Musk-OpenAI trial
  2. 2'Billionaires versus billionaires': Inside the bizarre scenes of the OpenAI trial
  3. 3Elon Musk X/Twitter Timeline (2026-05-16 to 2026-05-18)
  4. 4What we learned from the cringey courtroom drama between Elon Musk and Sam Altman
  5. 5The Real Losers of the Musk v. Altman Trial
  6. 6Inside Gemini Spark: Code Reveals The Skill System And Task Scheduler Powering Google's AI Agent
  7. 7Gemini app rolling out 'Extended' thinking level, new 3rd-party app integrations
  8. 8Google I/O 2026: What to Expect and How to Watch
  9. 9Google I/O 2026 Live Blog
  10. 10GitHub Copilot app is now available in technical preview
  11. 11Introducing Copilot CLI agent and unified sessions view in GitHub Copilot for JetBrains IDEs
  12. 12The Coding Harness Behind GitHub Copilot in VS Code
  13. 13Elon Musk's xAI Launches Grok Build, Its First AI Coding Agent
  14. 14Releases · openclaw/openclaw
  15. 15OpenClaw Creator Spent $1.3M on OpenAI Tokens in 30 Days
  16. 16Releases · NousResearch/hermes-agent
  17. 17Releases · langchain-ai/langchain
  18. 18GitHub - agentmemory/agentmemory (404)
  19. 19GitHub - memoria-ai/memoria (404)
  20. 20GitHub - TencentCloud/TencentDB-Agent-Memory (404)
  21. 21GitHub - NousResearch/hermes-agent
  22. 22GitHub - gastownhall/beads
  23. 23GitHub - Gentleman-Programming/engram
  24. 24GitHub - volcengine/OpenViking
  25. 25@Voxyz_ai: agent memory taxonomy
  26. 26GitHub Trending (2026-05-18)
  27. 27Not so locked in any more
  28. 28In 18 months, billing for AI agents will look like cloud infrastructure pricing
  29. 29Most things people ship as agents should be a workflow with one LLM call
  30. 30AI agents are fun until they start touching real data
  31. 31how to architect ai agents for regulatory approval?
  32. 32Researchers Claim Anthropic's Mythos Helped Crack macOS Security
  33. 33Launch HN: Voker (YC S24) – Analytics for AI Agents

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。