AI 全景情报 0626:Agent 接管工位,内存与云规则成为新战场
2026/6/26 · 8:14

AI 全景情报 0626:Agent 接管工位,内存与云规则成为新战场

本期聚焦 OpenAI/Google 的 Agent 执行化、Netris 背后的 neocloud 网络瓶颈、Micron/SK Hynix/Samsung 推动的内存和芯片资本开支,以及欧美对云、供应链和模型事故披露的监管收紧。

研究速览

今天的主线不是某个模型多跑了几分,而是 AI 产业的控制权继续向三处移动:工位里的 Agent、GPU 集群的网络层、以及云和芯片供应链的监管入口。对从业者来说,这意味着接下来 1-2 个季度的机会不会只在「调用更强模型」,而在谁能把 Agent 放进可审计的业务流程,谁能让算力更快上线,谁能提前处理云锁定、模型事故和供应链合规。
核心信号本期事实对从业者的直接含义
Agent 从聊天转向执行OpenAI 发布 Codex 经济潜力研究,称到 2026 年 5 月,80.6% 的抽样个人用户发起过估计超过 30 分钟人类工作量的 Codex 请求;Google DeepMind 则把 computer use 做进 Gemini 3.5 Flash。12Agent 产品的竞争重心转到任务编排、安全边界、权限确认和跨应用执行质量。
Neocloud 缺的不是 GPU 口号Netris 获 a16z 领投 1500 万美元 A 轮融资,其网络自动化平台已运行在 35 个以上 GPU 集群,覆盖约 100 万块 GPU。3AI 云的新瓶颈开始落在网络配置、多租户隔离和集群上线周期。
内存和芯片产能被市场重新定价Micron 因强劲业绩和 AI 内存需求带动股价一度涨超 17%,其客户已承诺 220 亿美元锁定内存芯片供应;SK Hynix 也计划通过美国上市募资最高 294 亿美元。45模型公司和云厂商的推理成本,接下来会更受 HBM、存储和资本开支节奏影响。
云、模型和事故报告被纳入硬规则欧盟反垄断监管方初步认为 AWS 与 Microsoft Azure 应被纳入 DMA「守门人」规则;美国议员也提出法案,要求 AI 模型开发者在 7 天内报告危险能力、安全漏洞和事故。67企业采购 AI 云与模型服务时,合规、可迁移性和事故上报机制会变成采购条款,而不是法务尾注。

1. Agent 已经开始占用「长任务」:OpenAI 给了数据,Google 补了执行入口

OpenAI 这次没有只讲 Codex 的能力展示,而是给出了一组内部和外部使用数据。它称到 2026 年 5 月,70.2% 的抽样个人用户发起过估计超过 1 小时人类工作量的 Codex 请求,25.6% 发起过估计超过 8 小时的请求;这些时间阈值由 LLM-as-judge 估计,且个人用户数据来自 0.1% 随机样本,所以更适合看方向,不适合当作精确生产率口径。1
更有意思的是非工程部门的迁移。OpenAI 称 Legal、Finance 和 Recruiting 在 2026 年 4 月左右也转向以 Codex 作为主要 AI 工具,普通 OpenAI 员工 85% 以上的输出 token 来自 Codex,公司内部每周输出 token 中 Codex 占 99.8%。1 这里的结论很直接:Agent 不再只是工程师写代码的效率工具,它开始吞掉数据整理、流程自动化、结构化分析和跨部门执行。
Google DeepMind 的动作把这条线又往前推了一步。Gemini 3.5 Flash 现在内置 computer use,开发者可通过 Gemini API 和 Gemini Enterprise Agent Platform 构建能在浏览器、移动端和桌面环境中「看、推理、操作」的自定义 Agent。Google 同时给了两类企业安全机制:敏感或不可逆操作前要求显式确认,以及识别间接提示注入后自动停止任务。2
这对 AI 从业者意味着什么?第一,Agent 产品的差异化不再只是模型 API 包一层 UI,而是要回答「能不能安全地碰真实系统」。第二,企业落地会优先买控制面:任务队列、权限、日志、回滚、人类确认、沙箱和提示注入防护。第三,非技术岗位会成为新的高增长用户,但他们需要的是能交付结果的工作流,不是一个更会聊天的窗口。

2. Netris 融资说明:AI 云的下一道门槛是网络,而不是再讲一遍 GPU 稀缺

TechCrunch 披露,Netris 获 a16z 领投 1500 万美元 A 轮融资。它的产品跑在网络交换机上,帮助 neocloud 运营商自动完成设置、配置和运维,并在硬件层做资源隔离和多租户支持。Netris CEO Alex Saroyan 的说法很关键:传统 SDN 对 AI 流量不够,因为 GPU 集群里的流量太高,网络动作必须硬件加速。3
Netris 数据中心拓扑界面
Netris 的拓扑界面显示 GPU 云需要同时管理大量链路和租户隔离,这正是 neocloud 上线速度的隐藏瓶颈。3
这条新闻小,但信号很硬。过去一年很多新云厂商的故事都是「我拿到了 GPU」。现在投资人开始看第二层:GPU 到了之后,集群能不能稳定上线,能不能快速给客户开租户,能不能在不泄露数据的前提下重配网络,能不能减少昂贵 GPU 空转的时间。
对创业团队来说,AI 基建机会会继续向「脏活累活」移动。网络自动化、资源调度、集群可观测、租户计费、故障隔离、合规模板,这些不如模型发布会性感,但更接近客户预算。Netris 还强调自己不用 AI,而是依赖确定性算法;这句话反而说明了一件事:AI 工厂里最值钱的某些环节,未必需要把 AI 塞进去。

3. 内存、HBM 和韩国芯片资本开支继续升温

Micron 的财报把市场情绪又推了一把。BNN Bloomberg 转引 Reuters 报道称,Micron 股价在强劲业绩和超预期指引后涨超 17%,公司客户已承诺 220 亿美元锁定内存芯片供应;Micron 还称需求继续远超供给,并让它和 SK Hynix、Samsung Electronics 能对高带宽内存收取溢价。4
SK Hynix 也在走资本市场路线。Yahoo Finance 转引 GuruFocus 报道称,SK Hynix 计划通过美国上市募资 45.45 万亿韩元,约 294 亿美元,所得资金用于扩产和采购 EUV 光刻机;其美国存托凭证预计 7 月 10 日开始交易。5 同一天晚些时候,Reuters 又报道三星集团据韩媒称将宣布未来 10 年在韩国投资 1000 万亿韩元,约 6475.3 亿美元,其中可能包括 300 万亿韩元用于韩国西南部芯片工厂。三星尚未在报道时段内回应。8
这一组信号对模型公司、推理云和企业客户都有含义。推理价格下降不能只看模型蒸馏和量化,内存供应、HBM 溢价、存储成本和新增产能时间表都会进入成本曲线。过去大家盯 GPU,接下来要把内存和先进封装一起看;如果多年度供货协议越来越常见,中小云厂商的采购窗口会更窄。

4. 欧洲和美国都在收紧 AI 的「运行规则」

欧盟这次瞄准的是云。Reuters 报道,欧盟反垄断监管方初步认为 AWS 和 Microsoft Azure 应被纳入 Digital Markets Act 的「守门人」规则。若最终落地,两家云服务商会面临限制自我优待、确保互操作性和数据可携带等义务。欧盟方面还明确提到,云服务已成为 AI 的前提条件,超过一半欧盟企业依赖云服务,AWS 和 Azure 的 AI 工具与合作关系也被列为云采购中的决定因素。6
欧盟旗帜
欧盟把云基础设施纳入 DMA 讨论,实际是在把 AI 运行环境和数字主权绑定到一起。6
同一天,Reuters 还报道欧盟委员会加入美国主导的 Pax Silica,该机制覆盖 AI 所需供应链安全,从能源、关键矿产、高端制造到 AI 模型。9 另一条欧洲模型线也值得放在一起看:意大利 Domyn CEO 称,公司将在一年内发布完全开源、可复现、超过 4000 亿参数的 AI 模型,企业和政府可在自己的基础设施上免费运行。Reuters 同时提醒,参数规模本身不能证明模型达到领先前沿系统能力。10
美国这边,AI Incident Reporting Act 草案要求模型开发者在发现危险活动后 7 天内向商务部报告,最严重事件由商务部 48 小时内通知国会;可报告事项包括模型试图逃避人类监督、绕过防护、未授权访问模型权重,以及化学、生物、核等公共安全威胁。7
这些新闻放在一起看,AI 合规正在从「模型输出内容」扩展到「模型在哪里跑、云能否迁移、供应链是否可信、事故能否上报」。对企业采购来说,未来的 RFP 会更具体:云服务可迁移吗?模型权重和日志在哪里?重大事故谁在 7 天内报告?提示注入和敏感操作如何留痕?如果供应商回答不上来,技术分再高也很难进关键业务。

未来 1-2 个季度看什么

  • Agent 控制面:看 OpenAI、Google、Anthropic、AWS 和 Azure 是否把权限、审计、沙箱、长期任务队列做成标准产品,而不是留给客户自己拼。
  • 推理云的上线效率:看 neocloud 是否开始把网络自动化、租户隔离和集群可观测当成卖点。GPU 到货只是第一步,能稳定售卖才是收入。
  • 内存供应协议:看 HBM、存储和先进封装是否继续出现多年锁单。模型推理成本下降的节奏,会受这些合同影响。
  • 云监管与主权模型:看欧盟是否最终把 AWS 和 Azure 纳入 DMA「守门人」规则,也看 Domyn、Mistral、OVHcloud 这类欧洲模型和云厂商能否把主权叙事变成可用产品。
  • 模型事故披露:美国如果推动 7 天事故报告框架,前沿模型公司需要把安全事件管理产品化;做企业 Agent 的公司也会被客户追问同样问题。
今天的行业温度很清楚:模型能力仍在进步,但钱和规则正在流向模型外部。Agent 要接入真实工作,云要接受迁移和监管,芯片链要拿到资本和锁单,安全事故要进入报告制度。AI 从业者如果只盯模型榜单,会错过这一轮真正能落预算的地方。

相似内容

基于内容相似度从其它频道挑选,发现新的关注对象

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。