
4/7/2026 · 8:15
AI 全景情报 0704:GPU 分成、企业 Agent 和实时视频挤向交付层
本期聚焦 NVIDIA 算力分成模式、阿里企业 Agent 整合、Vidu S1 实时视频、DeepX 日本边缘 AI 合作和英国 AI 生成滥用治理,判断 AI 竞争正从模型发布转向算力融资、企业入口、实时交互和可监管交付。
开源模型和闭源模型还在拼能力,但今天更值得看的不是榜单,而是交付方式。GPU 被做成带分成的融资工具,企业 Agent 从多个试验品收拢成一个入口,视频模型开始要求实时交互,边缘 NPU 走向工业渠道,儿童影像保护也被 AI 生成滥用逼成了具体指引。AI 行业的焦点正在从「谁的模型更强」转向「谁能把能力便宜、稳定、可控地送到真实场景里」。
今日速览
| 信号 | 事实核验 | 对 AI 从业者的含义 | 后续观察点 |
|---|---|---|---|
| NVIDIA 把 GPU 供给和分成绑定 | TNW 报道称,NVIDIA 正通过 revenue-sharing 与 credit-support 模式帮助 AI cloud 采购 GPU;Sharon AI 与 Firmus 是早期伙伴,Firmus 的印尼 Batam AI 工厂规划最高 17 万块 GPU。NVIDIA 官方博客也把该安排描述为面向 AI clouds 的 revenue-sharing 与 credit-support 模式。12 | 算力正在从硬件采购变成类似云收入证券化的结构。模型公司和 Agent 公司拿 GPU 的门槛会下降,但未来现金流会更深地绑在 NVIDIA 生态里。 | 未来伙伴是否标准化、分成比例是否披露,以及云厂商是否被迫接受更重的供应商绑定。 |
| 阿里收拢企业 Agent 产品线 | 36Kr Europe 转引智东西报道称,阿里确认将 QoderWork、钉钉孵化的 Wukong、阿里云内部创业团队的 MuleRun 深度整合,由 1992 年出生的陈禹森负责。3 | 企业 Agent 的竞争不再是做一个聊天入口,而是抢桌面、本地文件、组织协同和云端执行的统一控制面。 | 整合后是否能解决个人效率、企业权限和工作流复用之间的冲突。 |
| Vidu S1 把视频生成推向实时交互 | 生数科技在 PRNewswire 公告称,Vidu S1 支持语音引导的实时视频对话,可用单张图片创建交互角色,输出 540P、25 FPS,最高 42 FPS,并宣称可在消费级 GPU 上运行。4 | 视频生成的商业化对象从「一次性短片」转向「可连续响应的角色」。客服、直播、游戏 NPC 和陪伴产品会更早受到冲击。 | 真实延迟、长时身份一致性、内容安全和 API 计费方式。 |
| DeepX 借日本渠道推边缘 NPU | VentureSquare 报道称,DeepX 与日本技术分销商 Koshida Corporation 签署战略合作,面向制造、机器人和工业自动化推广边缘 AI 半导体;其 DX-M1 基于 5nm,标称最高 25 TOPS、功耗 3-5W。5 | 端侧 AI 不只看手机和 PC,也会先在工厂、物流、安防、机器人这些场景里跑出采购理由。低功耗 NPU 的关键不是跑分,而是渠道和参考方案。 | 是否能进入量产项目,以及 SDK、参考板和现场技术支持是否跟得上。 |
| 英国把 AI 生成滥用风险写成家长指引 | Guardian 报道称,英国 NCA 与 IWF 建议家长不要公开展示儿童照片,IWF 在 2025 年识别出 8,029 张/段逼真的 AI 生成儿童性虐待图像和视频,比前一年增加 14%。6 | 生成式影像产品会被要求承担更前置的身份、同意和未成年人保护责任。图片/视频平台不能只把安全当作下游审核问题。 | 监管会不会进一步要求上传前检测、素材来源追踪和未成年人图像默认保护。 |
1. GPU 赊账化:NVIDIA 开始卖「算力收益权」
NVIDIA 这次释放的信号不是又卖了多少芯片,而是换了一种让客户买得起芯片的方式。TNW 的报道把机制说得很直接:AI cloud 可以通过收入分成和信用支持取得大规模 GPU,再把 NVIDIA 驱动的云算力租给模型公司、Agent 平台和企业客户。1
Sharon AI 的协议规模是 6 年、72MW、最高 4 万块 Grace Blackwell GB300 GPU;Firmus 则在印尼 Batam 建 360MW 的 NVIDIA DSX AI factory,规划最高 17 万块 GPU。1 这类数字的重点不是炫规模,而是说明一件事:AI 算力采购已经接近项目融资。电力、园区、GPU、客户承诺和供应商信用被绑成一个包。
对从业者来说,这会改变两类公司的处境。AI-native 初创公司可能更容易拿到弹性算力,不必先签几年硬件采购;但推理成本也会更不透明,因为云账单里会叠加供应商分成、融资成本和区域电力条件。做模型服务、Agent 平台或垂直应用时,不能只问「有没有 H100/GB300」,还要问「这批算力的合约约束是什么」。
2. 阿里企业 Agent 整合:桌面、本地文件和组织协同要合成一个入口
阿里把 QoderWork、Wukong 和 MuleRun 收到一条线上,本质上是在承认分散试验已经不够用了。QoderWork 偏桌面智能体和本地执行,Wukong 承接钉钉协同,MuleRun 更像云端执行与流程复用引擎。36Kr Europe 转引智东西的报道称,这次整合将以 QoderWork 为基础,试图把「desktop + cloud + organization」连起来。3
企业 Agent 的难点不在能不能调用模型,而在能不能同时满足三件事:用户希望它直接操作本地文件和应用,企业希望权限、审计、数据边界可控,组织希望流程可以复用而不是每个人各写一套提示词。把三个产品整合到一个负责人下面,至少说明阿里在从「产品试水」转向「入口战争」。
这对产品经理和企业 IT 的判断很实际:采购 Agent 工具时,不要只看 demo 能否帮人写邮件、做表格。真正要评估的是它有没有稳定的权限模型、流程资产能不能沉淀、能否跨个人桌面和组织系统跑通。如果一家供应商只能做单点助手,很快会被更接近工作入口的平台挤压。
3. Vidu S1:视频模型开始从离线生成转向实时角色
Vidu S1 的关键指标不是「生成几秒视频」,而是实时交互。生数科技称,用户可以用语音持续控制 AI avatar,模型会结合当前语音、对话上下文和视觉上下文生成后续动作;它还支持从单张图片创建角色,输出 540P、25 FPS,最高 42 FPS。4
如果这些能力在真实产品中站得住,视频生成会从素材生产工具变成互动界面。AI 伴侣、虚拟主播、客服、教育助教、游戏 NPC 都不需要等一段视频渲完,而是让角色边听、边反应、边生成。竞争指标也会跟着变化:清晰度和美术风格仍然重要,但低延迟、身份一致性、语音情绪控制、长时稳定会变成更硬的门槛。
这里也有一条风险线。Vidu S1 公告称可用单张图片生成交互角色。4 这会降低创作门槛,也会把肖像授权、未成年人图像、虚假代言和实时内容审核推到产品第一层。做视频 Agent 的团队,不能等上线后再补安全策略。
4. DeepX 日本合作:边缘 AI 的商业化先看工业渠道
DeepX 与 Koshida 的合作看起来没有大模型发布那么热闹,但它更接近端侧 AI 的真实落地。VentureSquare 报道称,Koshida 将负责日本本地项目发现、产品提案、客户支持和供应链扩展,DeepX 提供 NPU 产品族、SDK、参考平台和技术支持。5
DX-M1 的标称参数是 5nm、最高 25 TOPS、3-5W。5 这个功耗区间说明它瞄准的不是训练,也不是云端大推理,而是摄像头、工业 PC、机器人、无人机、智慧工厂和边缘服务器。日本制造业、机器人和工业自动化需求明确,但客户通常不会因为一块芯片参数好就改系统,渠道、参考设计和现场支持更关键。
从行业判断看,边缘 AI 的窗口不在「所有设备都跑大模型」,而在「特定场景里把云端推理成本和延迟拿掉」。如果 DeepX 这类公司能通过分销商进入量产项目,小模型、视觉检测、实时控制和工业 Agent 会先于消费级硬件形成稳定采购。
5. AI 滥用治理正在前移到素材入口
英国 NCA 与 IWF 的新指引表面上面向家长,实际对生成式影像平台也有很强的产品含义。Guardian 报道称,IWF 在 2025 年识别出 8,029 张/段逼真的 AI 生成儿童性虐待图像和视频,比前一年增加 14%;指引建议家长把儿童照片限制在 close friends 群组,审查旧照片和学校、俱乐部等场景里的照片同意书。6
这说明监管压力正在从「生成后删除违规内容」前移到「素材能否被拿来生成」。对影像生成、头像驱动、虚拟角色和社交平台来说,未来的安全设计会更像身份与同意管理:谁上传了素材,素材里是否有未成年人,是否有可验证授权,生成结果是否可能复用真实脸部或身体特征。
做产品时,如果只把这件事交给关键词过滤和举报通道,风险会越来越大。更现实的做法是把敏感人像检测、年龄风险提示、默认私密可见性、可撤回授权和生成日志留存做进基础设施。否则,实时视频和单图成角色这类能力越强,平台越容易成为滥用链条的一部分。
趋势预判:下一轮竞争会压到「可融资、可整合、可治理」
今天这组信号可以连成一条线。NVIDIA 解决的是算力怎么被更多客户买得起,阿里解决的是企业 Agent 怎么从多头试验变成统一入口,Vidu S1 和 DeepX 分别把生成能力推向实时互动和工业现场,英国的安全指引则提醒所有影像 AI 产品:真实世界的合规成本不会等商业化成熟后才出现。
短期内,值得盯三件事:第一,GPU 分成和信用支持会不会成为 neocloud 的默认融资结构;第二,企业 Agent 是否从单点助手切到桌面/组织/云执行一体化;第三,视频和人像生成平台会不会被迫在上传入口就处理授权、年龄和身份风险。
如果这三条都成立,AI 行业的风口会从「发布一个更强模型」转向更硬的交付层:算力金融、企业 Agent 控制面、实时视频基础设施、边缘工业 AI 和生成式安全治理。真正能赚钱的公司,可能不是模型参数最大的一批,而是能把这些约束打包成稳定服务的一批。
Fuentes de referencia
- 1Nvidia offers AI startups compute now, payment later
- 2NVIDIA Unlocks AI Compute at Scale
- 3Alibaba AI Production Line Undergoes Major Restructuring
- 4ShengShu Technology Unveils Vidu S1
- 5DeepX Penetrates Japan's Industrial AI Ecosystem
- 6UK parents warned over posting images of children amid AI sexual abuse fears
Más de este canal
Contenido relacionado
- Inicia sesión para comentar.
