
2026. 6. 26. · 17:18
AI一手发言日报|过去24小时:Agent 进入工作流,模型开始接管界面与入口
本期追踪 2026-06-25 17:00 至 06-26 17:00(北京时间)内的公开一手材料,重点是 OpenAI、Google DeepMind、xAI、Microsoft AI、Anthropic 和 NVIDIA 的最新发言:Agent 正从聊天入口走向长任务、电脑操作和垂直业务场景。
리서치 브리프
本期窗口内最清晰的一条线索是:AI 公司不再只强调模型本身,而是在把模型推向更长时间、更高权限、更贴近业务系统的工作。OpenAI 把 Codex 写成内部工作方式的变化,Google DeepMind 把「computer use」放进 Gemini 3.5 Flash,xAI 继续把 Grok 接进具体软件和金融场景,Microsoft AI 则用图像模型排名和产品接入来证明自家模型栈的进展。
统计窗口:2026-06-25 17:00 至 2026-06-26 17:00(北京时间)。本期只纳入本人账号、公司官方账号和官方博客的一手材料;单纯转发、无新增判断的短帖不单独成条。
信号速览
| 人物 / 机构 | 窗口内一手材料 | 可以读出的信号 |
|---|---|---|
| Greg Brockman / OpenAI | Greg Brockman 在 2026-06-26 01:37(北京时间)转发 OpenAI 的 Codex 研究并说,agents 正被快速采用、正在加速工作;OpenAI 同日发布的研究称,Codex 已成为公司内部多部门的主要 AI 工作工具。12 | OpenAI 正把 agent 从「开发者工具」叙述成「组织工作方式」:衡量对象不只是答题质量,而是可委托任务时长、跨部门使用率和非技术岗位采用。 |
| Google DeepMind | Google DeepMind 在 2026-06-26 00:21(北京时间)称,Gemini 3.5 Flash 已支持原生 computer use,可让开发者构建能在浏览器、移动端和桌面界面中观察并执行动作的自定义 agents。34 | Google 的重点从「模型会调用工具」推进到「模型可直接操作界面」。同时,官方把用户确认、间接提示注入拦截和沙箱列入安全设计,说明 computer-use agent 的权限边界已成为产品核心问题。 |
| Anthropic | Anthropic 在 2026-06-26 00:33(北京时间)宣布加入 RAISE US,担任创始合作伙伴;其表述中,RAISE US 是一个非营利联盟,关注雇主主导的行动、AI-enabled training 和政策创新,以支持劳动力向 transformative AI 过渡。5 | Anthropic 今天没有发布新模型,但把公开发言落在「劳动力转型」上。对读者来说,这更像是监管和社会适应议题的铺垫,而不是产品路线更新。 |
| xAI | xAI 在 2026-06-26 01:22(北京时间)称,SuperGrok 与 X 订阅已可在 T3code 中使用;xAI 官网 6 月 25 日还发布 Interactive Brokers 与 Grok 的集成,覆盖组合分析、情景建模、市场研究和订单指令生成。67 | xAI 延续「把 Grok 放进现有工作台」的路线:从编码工具到经纪账户,重点不是单点聊天,而是让 Grok 接触用户已有的数据、权限和执行流程。 |
| Mustafa Suleyman / Microsoft AI | Microsoft AI CEO Mustafa Suleyman 在 2026-06-26 02:22(北京时间)称,MAI-Image-2.5 在 Artificial Analysis Image Arena 中位列文生图第 2、图像编辑第 3,并称 MAI-Image-2.5-Flash 在质量 / 价格上表现领先;该模型已通过 Foundry API 提供,并正进入 OneDrive 与 PowerPoint。8 | Microsoft AI 这条发言把「模型分数」和「办公产品分发」放在一起。排名用于证明能力,OneDrive 与 PowerPoint 则说明微软仍会优先把模型能力嵌入已有办公入口。 |
| NVIDIA AI | NVIDIA AI 在 2026-06-26 08:30(北京时间)称,NVIDIA 加入 Linux Foundation 与行业伙伴推出 Akrites;NVIDIA 首席安全官 David Reber 的原话是:「Transparency and open collaboration are how the cybersecurity community has kept infrastructure safe for decades. In the age of AI, these open source foundations have never been more critical.」9 | NVIDIA 今天的信号集中在 AI 安全基础设施和开源协作。它没有给出新芯片或训练指标,而是把 AI 时代的安全叙述和 Linux Foundation 这样的基础设施组织绑定。 |
重点拆解
1. OpenAI 把 Codex 当成组织行为样本,而不是单个产品更新
OpenAI 这篇研究的口径很明确:agentic AI 改变的是知识工作的基本单位,从一次对话转向可委托的长周期任务。文章称,截至 2026 年 5 月,抽样个人用户中,80.6% 至少发起过一次预计超过 30 分钟人类工作量的 Codex 请求,70.2% 至少发起过一次超过 1 小时的请求,25.6% 至少发起过一次超过 8 小时的请求。2
更值得看的是内部采用数据。OpenAI 称,Codex 现在占公司内部每周输出 token 的 99.8%;法律、财务和招聘等非技术部门在 2026 年 4 月左右也转为以 Codex 为主要 AI 工具,平均 OpenAI 员工超过 85% 的输出 token 来自 Codex。2 Greg Brockman 对这篇文章的概括更短:agents 正在被快速采用,并加速工作。1
这组材料的含义不是「Codex 会写代码」这么简单。OpenAI 正在用自家公司当样本,证明 agent 可以跨出工程部门,进入法务、招聘、财务这些过去不被看作 coding 场景的工作流。下一步值得盯的是外部企业客户是否也会出现类似的跨部门迁移,而不是只看开发者使用量。
2. Google DeepMind 把 computer use 做进主模型,安全设计随之变成卖点
Google DeepMind 今天在 X 上把重点放在 Gemini 3.5 Flash 的原生 computer use 上。官方文章说明,这项能力此前以独立 Gemini 2.5 computer use model 的形式存在,现在进入 Gemini 3.5 Flash 主模型;开发者可以用它构建能跨浏览器、移动端和桌面环境「see, reason and take action」的 agents。34
官方同时强调两类企业保护:敏感或不可逆操作前要求用户确认,以及在识别到间接提示注入时自动停止任务。文章还建议开发者结合安全沙箱、human-in-the-loop verification 和严格访问控制。4
这里的产品信号很清楚:模型能不能「点按钮」已经不只是演示效果,权限、回滚、确认和注入防护会决定企业是否敢接入。Google 把这部分写进发布稿,说明 computer-use agent 已经从实验能力进入商业部署讨论。
3. xAI 和 Microsoft AI 都在把模型塞进既有工作入口
xAI 的两条材料都不是模型参数更新。T3code 是开发者入口,Interactive Brokers 是金融账户入口。后者的官方文章称,Grok 可用于组合分析、经济事件和行业暴露的情景建模、市场研究,以及生成实时订单指令。67
Microsoft AI 的信号类似,但入口不同。Mustafa Suleyman 把 MAI-Image-2.5 的排行榜位置和分发路径放在同一条推文里:一边说模型在 Artificial Analysis 的图像竞技场中排名靠前,一边说它进入 Foundry API,并将进入 OneDrive 与 PowerPoint。8
这两家公司今天都在回答同一个问题:模型能力如何进入用户已经打开的工具。xAI 走订阅和第三方工具集成,Microsoft 走 API 与 Office 场景。对行业观察者来说,接下来要看的是这些入口带来的实际使用频次,而不是单次发布时列了多少合作伙伴。
4. Anthropic 与 NVIDIA 今天的发言偏「制度层」
Anthropic 加入 RAISE US 的材料把重点放在劳动力转型,关键词是雇主行动、AI 培训和政策创新。5 这类发言不会直接改变产品使用体验,但它提示 Anthropic 正在把「transformative AI」的社会适应问题前置到公共沟通里。
NVIDIA AI 的 Akrites 发言也不是产品参数,而是安全协作。David Reber 的原话把 AI 时代的基础设施安全与开源透明绑定。9 这和 NVIDIA 过去围绕 AI factory、训练效率和硬件平台的叙述不同,今天更像是在补安全与治理侧的拼图。
读者今天该重点盯什么
第一,agent 正在被各家公司推向「长任务 + 可执行环境」。OpenAI 用内部数据讲工作时长和跨部门采用,Google DeepMind 讲 computer use,xAI 讲软件和金融账户集成。判断一家公司 agent 路线是否真正进入生产,不该只看模型名,而要看它能接触哪些工具、数据和权限。
第二,安全和制度话题正在贴近产品层。Google 的 computer use 发布稿直接写提示注入防护,NVIDIA 把 Akrites 放在开源安全协作语境下,Anthropic 讨论劳动力转型。过去这些内容常被放在白皮书或政策页里,现在开始和产品发布、官方账号发言并排出现。
第三,本期没有看到 OpenAI Sam Altman、Anthropic Dario Amodei、Meta AI 官方账号、Mark Zuckerberg 等在窗口内给出可纳入正文的新一手判断;若账号只有转发且没有新增判断,本期按频道规则不纳入独立条目。




이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.