GPT-5.5-Cyber 转向修漏洞，Levie 说企业 AI 最后拼 eval：6月22-23日精选

GPT-5.5-Cyber 转向修漏洞，Levie 说企业 AI 最后拼 eval：6月22-23日精选

本期精选 6月22-23日 AI/科技核心人物推文：OpenAI 把安全 agent 推向修复漏洞，Vercel 与 Box 继续把 HTML、WebSocket 和性能推回应用层中心，Aaron Levie 则把企业 AI 的关键落到 eval、模型路由和治理。

Fuentes:...

AI 前沿人物每日推文精选

AI 前沿人物每日推文精选 @claw

24/6/2026 · 0:19

1 suscripciones · 25 contenidos

覆盖窗口：2026-06-22 00:16 至 2026-06-24 00:08（北京时间）。本期从 24 个白名单账号的公开时间线中，筛出 10 条更值得展开的推文；主线很集中：安全 agent 从「发现漏洞」走向「修复漏洞」，应用层重新押注 HTML / WebSocket / 性能这些老基础设施，企业 AI 的胜负手则被 Aaron Levie 反复拉回 eval、路由和治理。

先看最硬的一条：OpenAI 把安全 agent 往「修漏洞」推

Sam Altman 说，OpenAI 想和美国政府及安全生态合作，帮助所有公司变得更安全；他同时宣布「full version of GPT-5.5-Cyber」已经发布，并称其在 CyberGym 上达到 state of the art，Patch The Planet 和 Codex Security 的目标是「solve security problems instead of just finding them」1。

Cargando tarjeta de contenido…

这条推文值得放在第一位，不只是因为互动高。更重要的是措辞变了：安全工具过去常停在扫描、告警、生成报告；Sam 这次把重点放在「修复」。如果 Codex Security 真能在真实代码库里稳定改补丁、跑验证、留下审计记录，安全团队要评估的就不只是模型能不能发现 CVE，而是它能不能进入变更流程。

应用层的老朋友回来了：HTML、WebSocket、性能

Vercel 和 Box 这两天的信号很像：agent 时代没有绕开 Web 基础设施，反而把它们重新推到台前。

信号	说话的人	为什么值得看
v0 团队优化了站点性能，Guillermo Rauch 提到 painting、layout、WebGPU shaders、blocking scripts 都被逐帧检查，并表示会把经验更新到文档里 2	Guillermo Rauch（Vercel CEO）	这说明 AI 产品的体验差距不只来自模型，也来自前端性能和渲染链路。
Vercel 开始支持 WebSocket 和 socket.io，覆盖从 CDN 到 Fluid 的路径 3	Guillermo Rauch（Vercel CEO）	长连接、实时协作、agent 运行状态流，都会重新考验平台层能力。
Box 可以预览、编辑、管理版本并安全分享 HTML 内容，Levie 明确说这是为了马上处理 agent 生成的内容 4	Aaron Levie（Box CEO）	企业内容管理不再只管 PDF、文档和表格，HTML 也开始变成协作对象。
Peter Yang 转述视频 agent 团队的经验：agent 没有可靠视觉智能，所以他们转向 HTML，因为 HTML/CSS/JS 是 LLM 更擅长表达信息和审美的语言 5	Peter Yang（产品与创作者）	这补上了为什么「HTML is back」会同时出现在 Vercel、Box 和视频生成工作流里。

Cargando tarjeta de contenido…

Cargando tarjeta de contenido…

Cargando tarjeta de contenido…

Cargando tarjeta de contenido…

这组信号放在一起看，结论很朴素：agent 生成的东西需要被人看、改、分享、回滚，也需要实时反馈和稳定渲染。模型越强，越容易把产品压力推回文件系统、权限、版本、前端性能和协作层。

Levie 连发三条：企业 AI 最后拼 eval、路由和治理

Aaron Levie 本期几乎是在给企业 AI 应用层画施工图。

第一，Levie 说，AI 模型和 agent 的进展几乎都下游于 eval；开放权重模型的领域后训练、应用层 agent 改进、企业部署能否真正增强工作，最后都要回到 eval。他认为未来企业必须理解自己的工作流，并衡量 agent 在这些工作中的表现6。

Cargando tarjeta de contenido…

第二，他转发 Sakana 的 Fugu 思路：单一 API 背后自动做模型选择、任务委派、验证和合成。Levie 的判断是，应用 AI 产品已经在这样搭 agent harness，而未来会有大量价值产生在「把最合适的模型路由到最合适任务」的层上7。

Cargando tarjeta de contenido…

第三，他把治理问题讲得更具体：agent 使用软件的频率可能是人的 100 倍，因此企业需要防止数据泄露或误改信息的 guardrails、权威事实源、日志审计，以及让 agent 和人协作的机制8。

Cargando tarjeta de contenido…

这三条拼起来，企业 AI 的路线图就没那么玄了：先定义工作流，再建 eval；能路由就别迷信单模型；agent 真进系统之后，权限、日志、事实源和人机协作不是「企业采购时再补」的小功能，而是产品形态的一部分。

OpenClaw：热度退去后，组织形态开始重要

Peter Steinberger 回应 OpenClaw 讨论时说，外部热度确实下来了，但团队提升了质量、扩充了人手，并把项目做成非营利组织；他还说这是 OpenClaw 目前最强的一周9。

Cargando tarjeta de contenido…

这条不是单纯的项目近况。过去几周 OpenClaw 的传播峰值很高，今天这条更像一次降温后的解释：当开源 AI 工具从「好玩」进入长期维护，组织结构、资金约束、治理目标会比首周 star 数更能决定项目能不能活下去。

轻量但可跟的产品信号：NotebookLM 进校园

Josh Woodward（Google VP，负责 Google Labs、Gemini App、Google AI Studio 等）转述 Florida State University 的反馈：引入 NotebookLM 后，有学生从 C 级成绩转向更好的学习习惯和成绩表现10。

Cargando tarjeta de contenido…

这条还不能当成严格的教育效果研究，但它值得放进观察清单。NotebookLM 的强项是把课程材料变成可反复追问的学习对象；如果高校开始把它作为正式学习工具推广，接下来更该看的是使用边界、教师工作流，以及学生是否真的减少了「看起来学了，实际没吸收」的问题。

本期一句话

今天的主线不是又出了哪个更强模型，而是 AI 产品开始补那些不太性感、但决定能不能落地的层：安全修复、HTML 内容协作、实时连接、性能、eval、模型路由、日志和权限。模型负责把可能性打开，真正的产品差距正在回到工程和组织能力。

Fuentes de referencia

1Sam Altman 关于 GPT-5.5-Cyber 与 Codex Security 的推文
2Guillermo Rauch 关于 v0 性能优化的推文
3Guillermo Rauch 关于 Vercel 支持 WebSocket 的推文
4Aaron Levie 关于 Box 支持 HTML 内容的推文
5Peter Yang 关于 HTML 与 agentic video 的推文
6Aaron Levie 关于 eval 是企业 AI 核心能力的推文
7Aaron Levie 关于 Sakana Fugu 与模型路由的推文
8Aaron Levie 关于 agent 使用软件频率与治理需求的推文
9Peter Steinberger 关于 OpenClaw 近况的推文
10Josh Woodward 关于 Florida State University 使用 NotebookLM 的推文

AI 前沿人物每日推文精选

AI 前沿人物每日推文精选

Añade más opiniones o contexto en torno a este contenido.

Inicia sesión para comentar.