GPT-5.5-Cyber 转向修漏洞，Levie 说企业 AI 最后拼 eval：6月22-23日精选

覆盖窗口：2026-06-22 00:16 至 2026-06-24 00:08（北京时间）。本期从 24 个白名单账号的公开时间线中，筛出 10 条更值得展开的推文；主线很集中：安全 agent 从「发现漏洞」走向「修复漏洞」，应用层重新押注 HTML / WebSocket / 性能这些老基础设施，企业 AI 的胜负手则被 Aaron Levie 反复拉回 eval、路由和治理。

先看最硬的一条：OpenAI 把安全 agent 往「修漏洞」推

Sam Altman 说，OpenAI 想和美国政府及安全生态合作，帮助所有公司变得更安全；他同时宣布「full version of GPT-5.5-Cyber」已经发布，并称其在 CyberGym 上达到 state of the art，Patch The Planet 和 Codex Security 的目标是「solve security problems instead of just finding them」1。

콘텐츠 카드를 불러오는 중…

这条推文值得放在第一位，不只是因为互动高。更重要的是措辞变了：安全工具过去常停在扫描、告警、生成报告；Sam 这次把重点放在「修复」。如果 Codex Security 真能在真实代码库里稳定改补丁、跑验证、留下审计记录，安全团队要评估的就不只是模型能不能发现 CVE，而是它能不能进入变更流程。

应用层的老朋友回来了：HTML、WebSocket、性能

Vercel 和 Box 这两天的信号很像：agent 时代没有绕开 Web 基础设施，反而把它们重新推到台前。

信号	说话的人	为什么值得看
v0 团队优化了站点性能，Guillermo Rauch 提到 painting、layout、WebGPU shaders、blocking scripts 都被逐帧检查，并表示会把经验更新到文档里 2	Guillermo Rauch（Vercel CEO）	这说明 AI 产品的体验差距不只来自模型，也来自前端性能和渲染链路。
Vercel 开始支持 WebSocket 和 socket.io，覆盖从 CDN 到 Fluid 的路径 3	Guillermo Rauch（Vercel CEO）	长连接、实时协作、agent 运行状态流，都会重新考验平台层能力。
Box 可以预览、编辑、管理版本并安全分享 HTML 内容，Levie 明确说这是为了马上处理 agent 生成的内容 4	Aaron Levie（Box CEO）	企业内容管理不再只管 PDF、文档和表格，HTML 也开始变成协作对象。
Peter Yang 转述视频 agent 团队的经验：agent 没有可靠视觉智能，所以他们转向 HTML，因为 HTML/CSS/JS 是 LLM 更擅长表达信息和审美的语言 5	Peter Yang（产品与创作者）	这补上了为什么「HTML is back」会同时出现在 Vercel、Box 和视频生成工作流里。

콘텐츠 카드를 불러오는 중…

这组信号放在一起看，结论很朴素：agent 生成的东西需要被人看、改、分享、回滚，也需要实时反馈和稳定渲染。模型越强，越容易把产品压力推回文件系统、权限、版本、前端性能和协作层。

Levie 连发三条：企业 AI 最后拼 eval、路由和治理

Aaron Levie 本期几乎是在给企业 AI 应用层画施工图。

第一，Levie 说，AI 模型和 agent 的进展几乎都下游于 eval；开放权重模型的领域后训练、应用层 agent 改进、企业部署能否真正增强工作，最后都要回到 eval。他认为未来企业必须理解自己的工作流，并衡量 agent 在这些工作中的表现6。

콘텐츠 카드를 불러오는 중…

第二，他转发 Sakana 的 Fugu 思路：单一 API 背后自动做模型选择、任务委派、验证和合成。Levie 的判断是，应用 AI 产品已经在这样搭 agent harness，而未来会有大量价值产生在「把最合适的模型路由到最合适任务」的层上7。

콘텐츠 카드를 불러오는 중…

第三，他把治理问题讲得更具体：agent 使用软件的频率可能是人的 100 倍，因此企业需要防止数据泄露或误改信息的 guardrails、权威事实源、日志审计，以及让 agent 和人协作的机制8。

콘텐츠 카드를 불러오는 중…

这三条拼起来，企业 AI 的路线图就没那么玄了：先定义工作流，再建 eval；能路由就别迷信单模型；agent 真进系统之后，权限、日志、事实源和人机协作不是「企业采购时再补」的小功能，而是产品形态的一部分。

OpenClaw：热度退去后，组织形态开始重要

Peter Steinberger 回应 OpenClaw 讨论时说，外部热度确实下来了，但团队提升了质量、扩充了人手，并把项目做成非营利组织；他还说这是 OpenClaw 目前最强的一周9。

콘텐츠 카드를 불러오는 중…

这条不是单纯的项目近况。过去几周 OpenClaw 的传播峰值很高，今天这条更像一次降温后的解释：当开源 AI 工具从「好玩」进入长期维护，组织结构、资金约束、治理目标会比首周 star 数更能决定项目能不能活下去。

轻量但可跟的产品信号：NotebookLM 进校园

Josh Woodward（Google VP，负责 Google Labs、Gemini App、Google AI Studio 等）转述 Florida State University 的反馈：引入 NotebookLM 后，有学生从 C 级成绩转向更好的学习习惯和成绩表现10。

콘텐츠 카드를 불러오는 중…

这条还不能当成严格的教育效果研究，但它值得放进观察清单。NotebookLM 的强项是把课程材料变成可反复追问的学习对象；如果高校开始把它作为正式学习工具推广，接下来更该看的是使用边界、教师工作流，以及学生是否真的减少了「看起来学了，实际没吸收」的问题。

本期一句话

今天的主线不是又出了哪个更强模型，而是 AI 产品开始补那些不太性感、但决定能不能落地的层：安全修复、HTML 内容协作、实时连接、性能、eval、模型路由、日志和权限。模型负责把可能性打开，真正的产品差距正在回到工程和组织能力。

GPT-5.5-Cyber 转向修漏洞，Levie 说企业 AI 最后拼 eval：6月22-23日精选

先看最硬的一条：OpenAI 把安全 agent 往「修漏洞」推

应用层的老朋友回来了：HTML、WebSocket、性能

Levie 连发三条：企业 AI 最后拼 eval、路由和治理

OpenClaw：热度退去后，组织形态开始重要

轻量但可跟的产品信号：NotebookLM 进校园

本期一句话

참고 출처