AI脚本包：企业开始查 AI 账单了 (2026)

今天最适合拍的视频，不是「某个模型又强了多少」，而是企业终于开始认真看 AI 账单了。前两年大家拼命把 Token 往系统里灌，现在 CFO 开始问一句很朴素的话：这东西到底省了多少钱？

视频标题

企业开始查 AI 账单了：大模型价格战要变成生存战

封面文案

AI 不是不香了，是账单太香了

5 篇候选大纲

候选	爆款钩子	核心观点	展开路径
1. 企业 AI 账单失控，便宜模型开始反攻	一家 25 人 AI 公司把全部流量从 Claude 切到 DeepSeek，CEO 说这能在几个月内省下数百万美元；Uber 也被曝 4 个月用完全年 AI 预算。1	AI 落地进入第二阶段：从「能不能用」变成「能不能算得过账」。企业不会永远把所有任务交给最贵的前沿模型。	先讲 Tokenmaxxing 狂热，再讲预算刹车，最后落到模型路由：简单任务交给便宜模型，复杂任务才上最强模型。
2. OpenAI 也开始把模型做成「高低配套餐」	GPT-5.6 预览里同时出现 Sol、Terra、Luna 三档；OpenAI 称 Terra 与 GPT-5.5 有竞争力且便宜 2 倍，Luna 主打低成本。2	最强模型不再是唯一叙事，模型厂商也在主动承认：不同任务需要不同成本层级。	用手机「Pro / 标准 / Lite」类比模型分层，再拆 OpenAI 定价，最后问：这是不是前沿模型价格战的前奏？
3. Microsoft 把云运维做成 Agent 工作流	Microsoft 宣布 Azure Copilot Observability Agent 正式可用，称它基于 Azure Monitor，把日志、指标、链路追踪和拓扑上下文串起来。3	企业 Agent 真正值钱的地方不是聊天，而是把「故障定位」这种高压、碎片化工作接起来。	从一次线上故障切入，讲传统排障为什么慢，再讲 Observability Agent 的信号关联能力，最后落到「Agent 要进企业流水线，必须先学会承担责任」。
4. NVIDIA 把视频生成推理拆上多 GPU	NVIDIA 技术博客称 TensorRT 11.0 引入原生多设备推理，并用 NCCL 支持跨 GPU 集体通信；其测试覆盖 Cosmos 3 视频生成和 FLUX.1 图像生成管线。4	AIGC 视频越高清、越长，瓶颈越不只是模型，而是推理工程。谁能把生成任务稳定拆到多张 GPU 上，谁就更接近工业化。	用「一段 AI 视频为什么贵」开场，拆长序列注意力、显存和多 GPU 通信，再引到影视、广告、游戏的生成式生产线。
5. MWC 上海把 AI、6G、机器人摆到同一张桌上	2026 上海世界移动通信大会 6 月 24 日至 26 日举行，报道称现场吸引 143 个国家和地区的 37,300 名参会者，并集中讨论 AI 经济、6G 创新和智能网络。5	机器人、自动驾驶和低空经济不是单靠模型就能跑起来，底层通信和边缘算力会变成新战场。	从人形机器人点球大战的画面感切入，转到 AI 原生网络、OpenAN、5G-A 商用，再讲「智能体也需要高速公路」。

**最佳选题：候选 1。**它最适合做 5 分钟科技商业视频，因为它有冲突、有数字、有公司案例，也能把 OpenAI、Anthropic、DeepSeek、Microsoft、Google、Amazon 这些线串到同一个商业逻辑里：AI 行业的下一场仗，可能不是谁更聪明，而是谁更便宜、更可控、更会被企业采购。

最佳选题完整 5 分钟脚本

0:00-0:25 开场钩子

如果你以为企业现在最关心的是「哪个大模型最强」，那可能已经慢半拍了。

一家叫 Lindy 的 AI 初创公司，只有大约 25 人，却把 100% 的模型流量从 Anthropic Claude 切到 DeepSeek。CEO Flo Crivello 对 CNBC 说，成本曲线像「砸到地上」一样掉下去，几个月内能省下数百万美元。更狠的是，他说这不是优化，这是生存问题。1

这句话就是今天的视频核心：AI 没有退潮，但企业开始查账了。

0:25-1:10 第一幕：从狂用 AI 到预算刹车

过去两年，很多公司对 AI 的态度很简单：能用就多用，能接就多接。开发者疯狂调用编码 Agent，客服、市场、财务也开始把各种流程塞进模型。CNBC 把这种状态叫作 Tokenmaxxing，也就是把 Token 消耗尽量拉满。1

问题是，Token 不是免费的。Uber CTO 曾披露，公司在 4 个月内用完了全年 AI 预算；Uber 随后给部分 AI 工具设置了分层额度，基础层级每月 1,500 美元，想用更高额度还得申请。1

这里的画面可以这样拍：一开始是工程师兴奋地让 AI 写代码、查日志、改 PR；镜头一转，财务部门打开账单，表情变了。AI 不是不好用了，而是太好用了，好用到大家忘了每一次调用都在花钱。

1:10-2:00 第二幕：前沿模型正在失去「所有任务都归我」的特权

OpenAI 和 Anthropic 过去吃到的是「最强模型溢价」。企业想要最可靠的效果，就直接上最贵、最强的模型。这个逻辑在早期成立，因为大家还在试错，准确率比成本更重要。

但现在任务分层开始出现。AISquared CEO Darren Kimura 对 CNBC 说，用前沿模型处理简单任务，长期看对大多数公司都不可持续；Glean CEO Arvind Jain 的说法更直接，约 95% 的企业 AI 使用仍跑在前沿模型上。1

这就像你每天买菜都开超跑。不是不能开，是没必要。摘要、分类、普通客服、批量改格式，这些任务未必需要最贵模型。真正复杂的编码、研究、推理、风险判断，才值得上顶配。

拍摄时可以做一个「任务分拣机」画面：左边是简单任务，流向便宜模型；中间是中等任务，流向通用模型；右边是高风险任务，才进入前沿模型。观众会一下明白，模型路由不是技术细节，而是企业省钱的新开关。

2:00-2:50 第三幕：便宜模型为什么突然有机会

便宜模型不是今天才有。但过去企业担心两件事：能力差距太大，以及合规风险太高。

现在第一个问题正在缓解。财联社援引花旗研报称，今年 6 月 OpenRouter 平台处理的开源模型 Token 占比升至 65%，而今年 1 月这一比例为 34%；报道还称，中国 AI 模型与美国领先模型之间的性能差距正在缩小，价格约为每百万 Token 0.18 美元，美国顶级模型平均约为 4 美元。6

这些数字拍出来要谨慎。不要把它说成「中国模型全面赢了」，那太粗糙。更准确的表达是：当任务没有那么难，便宜模型已经足够好；当调用量足够大，哪怕单次只省几分钱，乘上百万、千万次调用，就是 CFO 会认真看的钱。

这也是 DeepSeek、开源模型和各家低成本模型被重新估值的原因。企业不是突然不爱前沿模型了，而是开始把 AI 当成一笔可以优化的云账单。

2:50-3:40 第四幕：大厂也在顺着这条路走

OpenAI 自己也在做分层。GPT-5.6 预览里，OpenAI 同时给出 Sol、Terra、Luna 三档：Sol 是旗舰，Terra 主打日常工作且 OpenAI 称它比 GPT-5.5 便宜 2 倍，Luna 则是更快、更便宜的低成本版本。其定价按每 100 万 Token 计算：Sol 输入 5 美元、输出 30 美元；Terra 输入 2.5 美元、输出 15 美元；Luna 输入 1 美元、输出 6 美元。2

这说明连 OpenAI 都知道，一个模型打天下的时代不舒服了。企业需要的是「模型菜单」，不是只有一道最贵的招牌菜。

Microsoft、Amazon、Google 也在往低成本、企业可控方向走。CNBC 报道称，Microsoft、Amazon、Google 都在扩展面向企业客户的低成本模型产品；Microsoft 还强调 GitHub Copilot 会根据任务把用户路由到更合适的模型。1

这里要把商业逻辑讲透：模型公司想卖最高毛利，云厂商想卖整套基础设施，企业客户想要可控 ROI。三方目标并不完全一致。价格战不是突然爆发，而是在这些目标错位里慢慢长出来的。

3:40-4:30 第五幕：真正的机会在「成本可控的 AI 系统」

接下来最有价值的公司，未必是单个最强模型，而是能帮企业回答三个问题的系统：

这个任务该用哪个模型？
这次调用有没有必要？
花出去的 Token 有没有带来业务结果？

这也是为什么模型路由、预算控制、可观测性、审计和权限会变得重要。OpenAI 近期推出企业支出分析和控制能力；CNBC 也提到，财务部门正在密切关注突如其来的 AI 账单，因为很多 CFO 年初根本没按这种增速做预算。1

这个地方可以给观众一个判断框架：如果一个 AI 产品只能展示「用了多少 Token」，价值还不够；如果它能展示「哪些任务省了多少人力、哪些调用浪费了钱、哪些模型性价比最高」，它才真正进入企业采购语言。

4:30-5:00 收束

所以，今天这个故事表面上是 OpenAI、Anthropic、DeepSeek 的价格问题，实际是企业 AI 从「尝鲜预算」进入「经营预算」。

尝鲜预算看演示，经营预算看账单。尝鲜预算关心效果惊不惊艳，经营预算关心每一次调用值不值。

下一轮 AI 竞争，前沿能力仍然重要，但它不再单独决定胜负。谁能把智能做得更便宜、更稳定、更可控，谁才更容易留在企业的系统里。

需要补查的关键信息

Lindy 切换到 DeepSeek 后的实际效果：CNBC 记录了 CEO 对成本下降的描述，但拍正式视频前最好补 Lindy 自身公开数据、客户留存或任务质量变化，避免只讲成本不讲效果。1
Uber AI 预算口径：目前公开报道提到「4 个月用完全年预算」和分层额度，但仍需补 Uber 内部预算口径、覆盖哪些 AI 工具、是否只限编码工具。1
OpenRouter 开源模型占比：财联社援引花旗研报给出 65% 与 34% 的对比，正式拍摄前应补花旗原研报或 OpenRouter 官方统计口径。6
中国模型合规边界：企业采用 DeepSeek 或其他中国开源模型时，数据驻留、隐私、供应链和监管要求会影响采购。视频里可点到，但不要把低价直接等同于可替代。6
OpenAI GPT-5.6 后续开放节奏：当前仍是有限预览，OpenAI 称会在未来几周扩大可用范围；拍摄前要确认是否已经面向 ChatGPT、Codex 或 API 更广泛开放。2

AI脚本包：企业开始查 AI 账单了