AI 全景情报 0704:GPU 分成、企业 Agent 和实时视频挤向交付层
2026/7/4 · 8:15

AI 全景情报 0704:GPU 分成、企业 Agent 和实时视频挤向交付层

本期聚焦 NVIDIA 算力分成模式、阿里企业 Agent 整合、Vidu S1 实时视频、DeepX 日本边缘 AI 合作和英国 AI 生成滥用治理,判断 AI 竞争正从模型发布转向算力融资、企业入口、实时交互和可监管交付。

开源模型和闭源模型还在拼能力,但今天更值得看的不是榜单,而是交付方式。GPU 被做成带分成的融资工具,企业 Agent 从多个试验品收拢成一个入口,视频模型开始要求实时交互,边缘 NPU 走向工业渠道,儿童影像保护也被 AI 生成滥用逼成了具体指引。AI 行业的焦点正在从「谁的模型更强」转向「谁能把能力便宜、稳定、可控地送到真实场景里」。

今日速览

信号事实核验对 AI 从业者的含义后续观察点
NVIDIA 把 GPU 供给和分成绑定TNW 报道称,NVIDIA 正通过 revenue-sharing 与 credit-support 模式帮助 AI cloud 采购 GPU;Sharon AI 与 Firmus 是早期伙伴,Firmus 的印尼 Batam AI 工厂规划最高 17 万块 GPU。NVIDIA 官方博客也把该安排描述为面向 AI clouds 的 revenue-sharing 与 credit-support 模式。12算力正在从硬件采购变成类似云收入证券化的结构。模型公司和 Agent 公司拿 GPU 的门槛会下降,但未来现金流会更深地绑在 NVIDIA 生态里。未来伙伴是否标准化、分成比例是否披露,以及云厂商是否被迫接受更重的供应商绑定。
阿里收拢企业 Agent 产品线36Kr Europe 转引智东西报道称,阿里确认将 QoderWork、钉钉孵化的 Wukong、阿里云内部创业团队的 MuleRun 深度整合,由 1992 年出生的陈禹森负责。3企业 Agent 的竞争不再是做一个聊天入口,而是抢桌面、本地文件、组织协同和云端执行的统一控制面。整合后是否能解决个人效率、企业权限和工作流复用之间的冲突。
Vidu S1 把视频生成推向实时交互生数科技在 PRNewswire 公告称,Vidu S1 支持语音引导的实时视频对话,可用单张图片创建交互角色,输出 540P、25 FPS,最高 42 FPS,并宣称可在消费级 GPU 上运行。4视频生成的商业化对象从「一次性短片」转向「可连续响应的角色」。客服、直播、游戏 NPC 和陪伴产品会更早受到冲击。真实延迟、长时身份一致性、内容安全和 API 计费方式。
DeepX 借日本渠道推边缘 NPUVentureSquare 报道称,DeepX 与日本技术分销商 Koshida Corporation 签署战略合作,面向制造、机器人和工业自动化推广边缘 AI 半导体;其 DX-M1 基于 5nm,标称最高 25 TOPS、功耗 3-5W。5端侧 AI 不只看手机和 PC,也会先在工厂、物流、安防、机器人这些场景里跑出采购理由。低功耗 NPU 的关键不是跑分,而是渠道和参考方案。是否能进入量产项目,以及 SDK、参考板和现场技术支持是否跟得上。
英国把 AI 生成滥用风险写成家长指引Guardian 报道称,英国 NCA 与 IWF 建议家长不要公开展示儿童照片,IWF 在 2025 年识别出 8,029 张/段逼真的 AI 生成儿童性虐待图像和视频,比前一年增加 14%。6生成式影像产品会被要求承担更前置的身份、同意和未成年人保护责任。图片/视频平台不能只把安全当作下游审核问题。监管会不会进一步要求上传前检测、素材来源追踪和未成年人图像默认保护。

1. GPU 赊账化:NVIDIA 开始卖「算力收益权」

NVIDIA 这次释放的信号不是又卖了多少芯片,而是换了一种让客户买得起芯片的方式。TNW 的报道把机制说得很直接:AI cloud 可以通过收入分成和信用支持取得大规模 GPU,再把 NVIDIA 驱动的云算力租给模型公司、Agent 平台和企业客户。1
Sharon AI 的协议规模是 6 年、72MW、最高 4 万块 Grace Blackwell GB300 GPU;Firmus 则在印尼 Batam 建 360MW 的 NVIDIA DSX AI factory,规划最高 17 万块 GPU。1 这类数字的重点不是炫规模,而是说明一件事:AI 算力采购已经接近项目融资。电力、园区、GPU、客户承诺和供应商信用被绑成一个包。
对从业者来说,这会改变两类公司的处境。AI-native 初创公司可能更容易拿到弹性算力,不必先签几年硬件采购;但推理成本也会更不透明,因为云账单里会叠加供应商分成、融资成本和区域电力条件。做模型服务、Agent 平台或垂直应用时,不能只问「有没有 H100/GB300」,还要问「这批算力的合约约束是什么」。

2. 阿里企业 Agent 整合:桌面、本地文件和组织协同要合成一个入口

阿里把 QoderWork、Wukong 和 MuleRun 收到一条线上,本质上是在承认分散试验已经不够用了。QoderWork 偏桌面智能体和本地执行,Wukong 承接钉钉协同,MuleRun 更像云端执行与流程复用引擎。36Kr Europe 转引智东西的报道称,这次整合将以 QoderWork 为基础,试图把「desktop + cloud + organization」连起来。3
企业 Agent 的难点不在能不能调用模型,而在能不能同时满足三件事:用户希望它直接操作本地文件和应用,企业希望权限、审计、数据边界可控,组织希望流程可以复用而不是每个人各写一套提示词。把三个产品整合到一个负责人下面,至少说明阿里在从「产品试水」转向「入口战争」。
这对产品经理和企业 IT 的判断很实际:采购 Agent 工具时,不要只看 demo 能否帮人写邮件、做表格。真正要评估的是它有没有稳定的权限模型、流程资产能不能沉淀、能否跨个人桌面和组织系统跑通。如果一家供应商只能做单点助手,很快会被更接近工作入口的平台挤压。

3. Vidu S1:视频模型开始从离线生成转向实时角色

Vidu S1 的关键指标不是「生成几秒视频」,而是实时交互。生数科技称,用户可以用语音持续控制 AI avatar,模型会结合当前语音、对话上下文和视觉上下文生成后续动作;它还支持从单张图片创建角色,输出 540P、25 FPS,最高 42 FPS。4
如果这些能力在真实产品中站得住,视频生成会从素材生产工具变成互动界面。AI 伴侣、虚拟主播、客服、教育助教、游戏 NPC 都不需要等一段视频渲完,而是让角色边听、边反应、边生成。竞争指标也会跟着变化:清晰度和美术风格仍然重要,但低延迟、身份一致性、语音情绪控制、长时稳定会变成更硬的门槛。
这里也有一条风险线。Vidu S1 公告称可用单张图片生成交互角色。4 这会降低创作门槛,也会把肖像授权、未成年人图像、虚假代言和实时内容审核推到产品第一层。做视频 Agent 的团队,不能等上线后再补安全策略。

4. DeepX 日本合作:边缘 AI 的商业化先看工业渠道

DeepX 与 Koshida 的合作看起来没有大模型发布那么热闹,但它更接近端侧 AI 的真实落地。VentureSquare 报道称,Koshida 将负责日本本地项目发现、产品提案、客户支持和供应链扩展,DeepX 提供 NPU 产品族、SDK、参考平台和技术支持。5
DX-M1 的标称参数是 5nm、最高 25 TOPS、3-5W。5 这个功耗区间说明它瞄准的不是训练,也不是云端大推理,而是摄像头、工业 PC、机器人、无人机、智慧工厂和边缘服务器。日本制造业、机器人和工业自动化需求明确,但客户通常不会因为一块芯片参数好就改系统,渠道、参考设计和现场支持更关键。
从行业判断看,边缘 AI 的窗口不在「所有设备都跑大模型」,而在「特定场景里把云端推理成本和延迟拿掉」。如果 DeepX 这类公司能通过分销商进入量产项目,小模型、视觉检测、实时控制和工业 Agent 会先于消费级硬件形成稳定采购。

5. AI 滥用治理正在前移到素材入口

英国 NCA 与 IWF 的新指引表面上面向家长,实际对生成式影像平台也有很强的产品含义。Guardian 报道称,IWF 在 2025 年识别出 8,029 张/段逼真的 AI 生成儿童性虐待图像和视频,比前一年增加 14%;指引建议家长把儿童照片限制在 close friends 群组,审查旧照片和学校、俱乐部等场景里的照片同意书。6
这说明监管压力正在从「生成后删除违规内容」前移到「素材能否被拿来生成」。对影像生成、头像驱动、虚拟角色和社交平台来说,未来的安全设计会更像身份与同意管理:谁上传了素材,素材里是否有未成年人,是否有可验证授权,生成结果是否可能复用真实脸部或身体特征。
做产品时,如果只把这件事交给关键词过滤和举报通道,风险会越来越大。更现实的做法是把敏感人像检测、年龄风险提示、默认私密可见性、可撤回授权和生成日志留存做进基础设施。否则,实时视频和单图成角色这类能力越强,平台越容易成为滥用链条的一部分。

趋势预判:下一轮竞争会压到「可融资、可整合、可治理」

今天这组信号可以连成一条线。NVIDIA 解决的是算力怎么被更多客户买得起,阿里解决的是企业 Agent 怎么从多头试验变成统一入口,Vidu S1 和 DeepX 分别把生成能力推向实时互动和工业现场,英国的安全指引则提醒所有影像 AI 产品:真实世界的合规成本不会等商业化成熟后才出现。
短期内,值得盯三件事:第一,GPU 分成和信用支持会不会成为 neocloud 的默认融资结构;第二,企业 Agent 是否从单点助手切到桌面/组织/云执行一体化;第三,视频和人像生成平台会不会被迫在上传入口就处理授权、年龄和身份风险。
如果这三条都成立,AI 行业的风口会从「发布一个更强模型」转向更硬的交付层:算力金融、企业 Agent 控制面、实时视频基础设施、边缘工业 AI 和生成式安全治理。真正能赚钱的公司,可能不是模型参数最大的一批,而是能把这些约束打包成稳定服务的一批。

このチャンネルのその他のコンテンツ

関連コンテンツ

  • ログインするとコメントできます。