AI一手发言日报|过去24小时:Agent 进入工作流,模型开始接管界面与入口
26/6/2026 · 17:18

AI一手发言日报|过去24小时:Agent 进入工作流,模型开始接管界面与入口

本期追踪 2026-06-25 17:00 至 06-26 17:00(北京时间)内的公开一手材料,重点是 OpenAI、Google DeepMind、xAI、Microsoft AI、Anthropic 和 NVIDIA 的最新发言:Agent 正从聊天入口走向长任务、电脑操作和垂直业务场景。

Vistazo a la investigación

本期窗口内最清晰的一条线索是:AI 公司不再只强调模型本身,而是在把模型推向更长时间、更高权限、更贴近业务系统的工作。OpenAI 把 Codex 写成内部工作方式的变化,Google DeepMind 把「computer use」放进 Gemini 3.5 Flash,xAI 继续把 Grok 接进具体软件和金融场景,Microsoft AI 则用图像模型排名和产品接入来证明自家模型栈的进展。
统计窗口:2026-06-25 17:00 至 2026-06-26 17:00(北京时间)。本期只纳入本人账号、公司官方账号和官方博客的一手材料;单纯转发、无新增判断的短帖不单独成条。

信号速览

人物 / 机构窗口内一手材料可以读出的信号
Greg Brockman / OpenAIGreg Brockman 在 2026-06-26 01:37(北京时间)转发 OpenAI 的 Codex 研究并说,agents 正被快速采用、正在加速工作;OpenAI 同日发布的研究称,Codex 已成为公司内部多部门的主要 AI 工作工具。12OpenAI 正把 agent 从「开发者工具」叙述成「组织工作方式」:衡量对象不只是答题质量,而是可委托任务时长、跨部门使用率和非技术岗位采用。
Google DeepMindGoogle DeepMind 在 2026-06-26 00:21(北京时间)称,Gemini 3.5 Flash 已支持原生 computer use,可让开发者构建能在浏览器、移动端和桌面界面中观察并执行动作的自定义 agents。34Google 的重点从「模型会调用工具」推进到「模型可直接操作界面」。同时,官方把用户确认、间接提示注入拦截和沙箱列入安全设计,说明 computer-use agent 的权限边界已成为产品核心问题。
AnthropicAnthropic 在 2026-06-26 00:33(北京时间)宣布加入 RAISE US,担任创始合作伙伴;其表述中,RAISE US 是一个非营利联盟,关注雇主主导的行动、AI-enabled training 和政策创新,以支持劳动力向 transformative AI 过渡。5Anthropic 今天没有发布新模型,但把公开发言落在「劳动力转型」上。对读者来说,这更像是监管和社会适应议题的铺垫,而不是产品路线更新。
xAIxAI 在 2026-06-26 01:22(北京时间)称,SuperGrok 与 X 订阅已可在 T3code 中使用;xAI 官网 6 月 25 日还发布 Interactive Brokers 与 Grok 的集成,覆盖组合分析、情景建模、市场研究和订单指令生成。67xAI 延续「把 Grok 放进现有工作台」的路线:从编码工具到经纪账户,重点不是单点聊天,而是让 Grok 接触用户已有的数据、权限和执行流程。
Mustafa Suleyman / Microsoft AIMicrosoft AI CEO Mustafa Suleyman 在 2026-06-26 02:22(北京时间)称,MAI-Image-2.5 在 Artificial Analysis Image Arena 中位列文生图第 2、图像编辑第 3,并称 MAI-Image-2.5-Flash 在质量 / 价格上表现领先;该模型已通过 Foundry API 提供,并正进入 OneDrive 与 PowerPoint。8Microsoft AI 这条发言把「模型分数」和「办公产品分发」放在一起。排名用于证明能力,OneDrive 与 PowerPoint 则说明微软仍会优先把模型能力嵌入已有办公入口。
NVIDIA AINVIDIA AI 在 2026-06-26 08:30(北京时间)称,NVIDIA 加入 Linux Foundation 与行业伙伴推出 Akrites;NVIDIA 首席安全官 David Reber 的原话是:「Transparency and open collaboration are how the cybersecurity community has kept infrastructure safe for decades. In the age of AI, these open source foundations have never been more critical.」9NVIDIA 今天的信号集中在 AI 安全基础设施和开源协作。它没有给出新芯片或训练指标,而是把 AI 时代的安全叙述和 Linux Foundation 这样的基础设施组织绑定。

重点拆解

1. OpenAI 把 Codex 当成组织行为样本,而不是单个产品更新

OpenAI 这篇研究的口径很明确:agentic AI 改变的是知识工作的基本单位,从一次对话转向可委托的长周期任务。文章称,截至 2026 年 5 月,抽样个人用户中,80.6% 至少发起过一次预计超过 30 分钟人类工作量的 Codex 请求,70.2% 至少发起过一次超过 1 小时的请求,25.6% 至少发起过一次超过 8 小时的请求。2
更值得看的是内部采用数据。OpenAI 称,Codex 现在占公司内部每周输出 token 的 99.8%;法律、财务和招聘等非技术部门在 2026 年 4 月左右也转为以 Codex 为主要 AI 工具,平均 OpenAI 员工超过 85% 的输出 token 来自 Codex。2 Greg Brockman 对这篇文章的概括更短:agents 正在被快速采用,并加速工作。1
这组材料的含义不是「Codex 会写代码」这么简单。OpenAI 正在用自家公司当样本,证明 agent 可以跨出工程部门,进入法务、招聘、财务这些过去不被看作 coding 场景的工作流。下一步值得盯的是外部企业客户是否也会出现类似的跨部门迁移,而不是只看开发者使用量。

2. Google DeepMind 把 computer use 做进主模型,安全设计随之变成卖点

Google DeepMind 今天在 X 上把重点放在 Gemini 3.5 Flash 的原生 computer use 上。官方文章说明,这项能力此前以独立 Gemini 2.5 computer use model 的形式存在,现在进入 Gemini 3.5 Flash 主模型;开发者可以用它构建能跨浏览器、移动端和桌面环境「see, reason and take action」的 agents。34
官方同时强调两类企业保护:敏感或不可逆操作前要求用户确认,以及在识别到间接提示注入时自动停止任务。文章还建议开发者结合安全沙箱、human-in-the-loop verification 和严格访问控制。4
这里的产品信号很清楚:模型能不能「点按钮」已经不只是演示效果,权限、回滚、确认和注入防护会决定企业是否敢接入。Google 把这部分写进发布稿,说明 computer-use agent 已经从实验能力进入商业部署讨论。

3. xAI 和 Microsoft AI 都在把模型塞进既有工作入口

xAI 的两条材料都不是模型参数更新。T3code 是开发者入口,Interactive Brokers 是金融账户入口。后者的官方文章称,Grok 可用于组合分析、经济事件和行业暴露的情景建模、市场研究,以及生成实时订单指令。67
Microsoft AI 的信号类似,但入口不同。Mustafa Suleyman 把 MAI-Image-2.5 的排行榜位置和分发路径放在同一条推文里:一边说模型在 Artificial Analysis 的图像竞技场中排名靠前,一边说它进入 Foundry API,并将进入 OneDrive 与 PowerPoint。8
这两家公司今天都在回答同一个问题:模型能力如何进入用户已经打开的工具。xAI 走订阅和第三方工具集成,Microsoft 走 API 与 Office 场景。对行业观察者来说,接下来要看的是这些入口带来的实际使用频次,而不是单次发布时列了多少合作伙伴。

4. Anthropic 与 NVIDIA 今天的发言偏「制度层」

Anthropic 加入 RAISE US 的材料把重点放在劳动力转型,关键词是雇主行动、AI 培训和政策创新。5 这类发言不会直接改变产品使用体验,但它提示 Anthropic 正在把「transformative AI」的社会适应问题前置到公共沟通里。
NVIDIA AI 的 Akrites 发言也不是产品参数,而是安全协作。David Reber 的原话把 AI 时代的基础设施安全与开源透明绑定。9 这和 NVIDIA 过去围绕 AI factory、训练效率和硬件平台的叙述不同,今天更像是在补安全与治理侧的拼图。

读者今天该重点盯什么

第一,agent 正在被各家公司推向「长任务 + 可执行环境」。OpenAI 用内部数据讲工作时长和跨部门采用,Google DeepMind 讲 computer use,xAI 讲软件和金融账户集成。判断一家公司 agent 路线是否真正进入生产,不该只看模型名,而要看它能接触哪些工具、数据和权限。
第二,安全和制度话题正在贴近产品层。Google 的 computer use 发布稿直接写提示注入防护,NVIDIA 把 Akrites 放在开源安全协作语境下,Anthropic 讨论劳动力转型。过去这些内容常被放在白皮书或政策页里,现在开始和产品发布、官方账号发言并排出现。
第三,本期没有看到 OpenAI Sam Altman、Anthropic Dario Amodei、Meta AI 官方账号、Mark Zuckerberg 等在窗口内给出可纳入正文的新一手判断;若账号只有转发且没有新增判断,本期按频道规则不纳入独立条目。

Contenido relacionado

Añade más opiniones o contexto en torno a este contenido.

  • Inicia sesión para comentar.