
2026. 6. 30. · 08:14
AI脚本包:企业开始查 AI 账单了
这期把企业 AI 账单、模型路由、OpenAI 分层定价、Microsoft 运维 Agent、NVIDIA 多 GPU 推理和 MWC AI+6G 动态转成 5 个可拍选题,并完整写出一支关于 AI 成本战的 5 分钟科技商业脚本。
今天最适合拍的视频,不是「某个模型又强了多少」,而是企业终于开始认真看 AI 账单了。前两年大家拼命把 Token 往系统里灌,现在 CFO 开始问一句很朴素的话:这东西到底省了多少钱?
视频标题
企业开始查 AI 账单了:大模型价格战要变成生存战
封面文案
AI 不是不香了,是账单太香了
5 篇候选大纲
| 候选 | 爆款钩子 | 核心观点 | 展开路径 |
|---|---|---|---|
| 1. 企业 AI 账单失控,便宜模型开始反攻 | 一家 25 人 AI 公司把全部流量从 Claude 切到 DeepSeek,CEO 说这能在几个月内省下数百万美元;Uber 也被曝 4 个月用完全年 AI 预算。1 | AI 落地进入第二阶段:从「能不能用」变成「能不能算得过账」。企业不会永远把所有任务交给最贵的前沿模型。 | 先讲 Tokenmaxxing 狂热,再讲预算刹车,最后落到模型路由:简单任务交给便宜模型,复杂任务才上最强模型。 |
| 2. OpenAI 也开始把模型做成「高低配套餐」 | GPT-5.6 预览里同时出现 Sol、Terra、Luna 三档;OpenAI 称 Terra 与 GPT-5.5 有竞争力且便宜 2 倍,Luna 主打低成本。2 | 最强模型不再是唯一叙事,模型厂商也在主动承认:不同任务需要不同成本层级。 | 用手机「Pro / 标准 / Lite」类比模型分层,再拆 OpenAI 定价,最后问:这是不是前沿模型价格战的前奏? |
| 3. Microsoft 把云运维做成 Agent 工作流 | Microsoft 宣布 Azure Copilot Observability Agent 正式可用,称它基于 Azure Monitor,把日志、指标、链路追踪和拓扑上下文串起来。3 | 企业 Agent 真正值钱的地方不是聊天,而是把「故障定位」这种高压、碎片化工作接起来。 | 从一次线上故障切入,讲传统排障为什么慢,再讲 Observability Agent 的信号关联能力,最后落到「Agent 要进企业流水线,必须先学会承担责任」。 |
| 4. NVIDIA 把视频生成推理拆上多 GPU | NVIDIA 技术博客称 TensorRT 11.0 引入原生多设备推理,并用 NCCL 支持跨 GPU 集体通信;其测试覆盖 Cosmos 3 视频生成和 FLUX.1 图像生成管线。4 | AIGC 视频越高清、越长,瓶颈越不只是模型,而是推理工程。谁能把生成任务稳定拆到多张 GPU 上,谁就更接近工业化。 | 用「一段 AI 视频为什么贵」开场,拆长序列注意力、显存和多 GPU 通信,再引到影视、广告、游戏的生成式生产线。 |
| 5. MWC 上海把 AI、6G、机器人摆到同一张桌上 | 2026 上海世界移动通信大会 6 月 24 日至 26 日举行,报道称现场吸引 143 个国家和地区的 37,300 名参会者,并集中讨论 AI 经济、6G 创新和智能网络。5 | 机器人、自动驾驶和低空经济不是单靠模型就能跑起来,底层通信和边缘算力会变成新战场。 | 从人形机器人点球大战的画面感切入,转到 AI 原生网络、OpenAN、5G-A 商用,再讲「智能体也需要高速公路」。 |
**最佳选题:候选 1。**它最适合做 5 分钟科技商业视频,因为它有冲突、有数字、有公司案例,也能把 OpenAI、Anthropic、DeepSeek、Microsoft、Google、Amazon 这些线串到同一个商业逻辑里:AI 行业的下一场仗,可能不是谁更聪明,而是谁更便宜、更可控、更会被企业采购。
最佳选题完整 5 分钟脚本
0:00-0:25 开场钩子
如果你以为企业现在最关心的是「哪个大模型最强」,那可能已经慢半拍了。
一家叫 Lindy 的 AI 初创公司,只有大约 25 人,却把 100% 的模型流量从 Anthropic Claude 切到 DeepSeek。CEO Flo Crivello 对 CNBC 说,成本曲线像「砸到地上」一样掉下去,几个月内能省下数百万美元。更狠的是,他说这不是优化,这是生存问题。1
这句话就是今天的视频核心:AI 没有退潮,但企业开始查账了。
0:25-1:10 第一幕:从狂用 AI 到预算刹车
过去两年,很多公司对 AI 的态度很简单:能用就多用,能接就多接。开发者疯狂调用编码 Agent,客服、市场、财务也开始把各种流程塞进模型。CNBC 把这种状态叫作 Tokenmaxxing,也就是把 Token 消耗尽量拉满。1
问题是,Token 不是免费的。Uber CTO 曾披露,公司在 4 个月内用完了全年 AI 预算;Uber 随后给部分 AI 工具设置了分层额度,基础层级每月 1,500 美元,想用更高额度还得申请。1
这里的画面可以这样拍:一开始是工程师兴奋地让 AI 写代码、查日志、改 PR;镜头一转,财务部门打开账单,表情变了。AI 不是不好用了,而是太好用了,好用到大家忘了每一次调用都在花钱。
1:10-2:00 第二幕:前沿模型正在失去「所有任务都归我」的特权
OpenAI 和 Anthropic 过去吃到的是「最强模型溢价」。企业想要最可靠的效果,就直接上最贵、最强的模型。这个逻辑在早期成立,因为大家还在试错,准确率比成本更重要。
但现在任务分层开始出现。AISquared CEO Darren Kimura 对 CNBC 说,用前沿模型处理简单任务,长期看对大多数公司都不可持续;Glean CEO Arvind Jain 的说法更直接,约 95% 的企业 AI 使用仍跑在前沿模型上。1
这就像你每天买菜都开超跑。不是不能开,是没必要。摘要、分类、普通客服、批量改格式,这些任务未必需要最贵模型。真正复杂的编码、研究、推理、风险判断,才值得上顶配。
拍摄时可以做一个「任务分拣机」画面:左边是简单任务,流向便宜模型;中间是中等任务,流向通用模型;右边是高风险任务,才进入前沿模型。观众会一下明白,模型路由不是技术细节,而是企业省钱的新开关。
2:00-2:50 第三幕:便宜模型为什么突然有机会
便宜模型不是今天才有。但过去企业担心两件事:能力差距太大,以及合规风险太高。
现在第一个问题正在缓解。财联社援引花旗研报称,今年 6 月 OpenRouter 平台处理的开源模型 Token 占比升至 65%,而今年 1 月这一比例为 34%;报道还称,中国 AI 模型与美国领先模型之间的性能差距正在缩小,价格约为每百万 Token 0.18 美元,美国顶级模型平均约为 4 美元。6
这些数字拍出来要谨慎。不要把它说成「中国模型全面赢了」,那太粗糙。更准确的表达是:当任务没有那么难,便宜模型已经足够好;当调用量足够大,哪怕单次只省几分钱,乘上百万、千万次调用,就是 CFO 会认真看的钱。
这也是 DeepSeek、开源模型和各家低成本模型被重新估值的原因。企业不是突然不爱前沿模型了,而是开始把 AI 当成一笔可以优化的云账单。
2:50-3:40 第四幕:大厂也在顺着这条路走
OpenAI 自己也在做分层。GPT-5.6 预览里,OpenAI 同时给出 Sol、Terra、Luna 三档:Sol 是旗舰,Terra 主打日常工作且 OpenAI 称它比 GPT-5.5 便宜 2 倍,Luna 则是更快、更便宜的低成本版本。其定价按每 100 万 Token 计算:Sol 输入 5 美元、输出 30 美元;Terra 输入 2.5 美元、输出 15 美元;Luna 输入 1 美元、输出 6 美元。2
这说明连 OpenAI 都知道,一个模型打天下的时代不舒服了。企业需要的是「模型菜单」,不是只有一道最贵的招牌菜。
Microsoft、Amazon、Google 也在往低成本、企业可控方向走。CNBC 报道称,Microsoft、Amazon、Google 都在扩展面向企业客户的低成本模型产品;Microsoft 还强调 GitHub Copilot 会根据任务把用户路由到更合适的模型。1
这里要把商业逻辑讲透:模型公司想卖最高毛利,云厂商想卖整套基础设施,企业客户想要可控 ROI。三方目标并不完全一致。价格战不是突然爆发,而是在这些目标错位里慢慢长出来的。
3:40-4:30 第五幕:真正的机会在「成本可控的 AI 系统」
接下来最有价值的公司,未必是单个最强模型,而是能帮企业回答三个问题的系统:
- 这个任务该用哪个模型?
- 这次调用有没有必要?
- 花出去的 Token 有没有带来业务结果?
这也是为什么模型路由、预算控制、可观测性、审计和权限会变得重要。OpenAI 近期推出企业支出分析和控制能力;CNBC 也提到,财务部门正在密切关注突如其来的 AI 账单,因为很多 CFO 年初根本没按这种增速做预算。1
这个地方可以给观众一个判断框架:如果一个 AI 产品只能展示「用了多少 Token」,价值还不够;如果它能展示「哪些任务省了多少人力、哪些调用浪费了钱、哪些模型性价比最高」,它才真正进入企业采购语言。
4:30-5:00 收束
所以,今天这个故事表面上是 OpenAI、Anthropic、DeepSeek 的价格问题,实际是企业 AI 从「尝鲜预算」进入「经营预算」。
尝鲜预算看演示,经营预算看账单。尝鲜预算关心效果惊不惊艳,经营预算关心每一次调用值不值。
下一轮 AI 竞争,前沿能力仍然重要,但它不再单独决定胜负。谁能把智能做得更便宜、更稳定、更可控,谁才更容易留在企业的系统里。
需要补查的关键信息
- Lindy 切换到 DeepSeek 后的实际效果:CNBC 记录了 CEO 对成本下降的描述,但拍正式视频前最好补 Lindy 自身公开数据、客户留存或任务质量变化,避免只讲成本不讲效果。1
- Uber AI 预算口径:目前公开报道提到「4 个月用完全年预算」和分层额度,但仍需补 Uber 内部预算口径、覆盖哪些 AI 工具、是否只限编码工具。1
- OpenRouter 开源模型占比:财联社援引花旗研报给出 65% 与 34% 的对比,正式拍摄前应补花旗原研报或 OpenRouter 官方统计口径。6
- 中国模型合规边界:企业采用 DeepSeek 或其他中国开源模型时,数据驻留、隐私、供应链和监管要求会影响采购。视频里可点到,但不要把低价直接等同于可替代。6
- OpenAI GPT-5.6 后续开放节奏:当前仍是有限预览,OpenAI 称会在未来几周扩大可用范围;拍摄前要确认是否已经面向 ChatGPT、Codex 或 API 更广泛开放。2
참고 출처
- 1OpenAI, Anthropic new AI spending reality as users shift to efficiency
- 2Previewing GPT‑5.6 Sol: a next-generation model
- 3Rethinking cloud operations with agentic observability
- 4Scaling AI Inference Across Multiple GPUs Using NVIDIA TensorRT with Multi-Device Inference Support
- 5MWC26上海闭幕:AI与6G驱动通信迈向智能协同
- 6AI账单越来越高 企业开始转向更便宜的模型 DeepSeek等中国AI有望受益
이 채널의 다른 콘텐츠
관련 콘텐츠
- 로그인하면 댓글을 작성할 수 있습니다.
