AI账单炸了!豆包视频冲到30秒
24/6/2026 · 8:13

AI账单炸了!豆包视频冲到30秒

6月23日前后,AI行业主线从模型刷榜转向成本与控制:Oracle把AI部署写进裁员口径,字节推30秒视频模型,Anthropic锁内存供应,Groq和Menlo继续给推理云与AI创业公司补弹药。

今天这波,AI 不是「又变聪明了」这么简单。
更像是账单开始拍门:美股芯片链被砸,Oracle 把 2.1 万个岗位写进 AI 重组,Anthropic 去锁内存供应,Groq 拿钱续命,字节则在视频、图像、音频、大模型上同时加速。
一句话:模型大战还在继续,但真正变紧的是 钱、电、芯片和可控成本

5 分钟速览

事件关键信息先看什么
AI 概念股回撤6 月 23 日,美股纳指跌 2.21%,费城半导体指数跌 7.9%,Nvidia 跌 4.1%,Micron 和 SanDisk 均跌约 13%;Reuters 把原因指向债务融资式 AI 支出遭投资者重新审视。1AI 资本开支不再只被当作增长故事,也开始被当作负债故事。
Oracle 裁员 2.1 万Oracle 年度文件显示,全职员工从 16.2 万降到 14.1 万,并称 AI 技术在内部的采用和部署已经、并可能继续导致裁员。2企业 AI 的第一刀,不一定砍模型成本,可能先砍组织。
字节推 Seedance 2.5ByteDance 在火山引擎 FORCE 大会上推出 5 个新模型;Seedance 2.5 可生成最长 30 秒单段视频,并支持最多 50 个参考输入。3AI 视频从「短 demo」继续往可控制作工具靠。
Micron 绑定 AnthropicMicron 官方宣布,与 Anthropic 达成战略协议,覆盖内存/存储架构设计、供应协议、Claude 在 Micron 内部采用,以及对 Anthropic Series H 的战略投资。4前沿模型公司开始把 HBM、DRAM、SSD 这类底层资源提前锁住。
Groq 再融 6.5 亿美元Groq 官方称,新一轮 6.5 亿美元资金将用于扩张 AI 推理云;公司目前有 13 个数据中心,服务 500 多万开发者,每周处理数万亿 tokens。5训练之后,推理云开始抢钱、抢机房、抢客户。
Menlo 加码 AIMenlo Ventures 宣布募得 30 亿美元新资金,是其 50 年历史上最大募资,投向 AI 基础设施、前沿模型和 AI 原生应用。6AI 资金没有撤,只是更挑:谁能降成本、拿客户、守住供应链,谁更容易拿钱。
纽约证券交易所交易员
纽约证券交易所交易现场,6 月 23 日芯片股回撤把 AI 资本开支疑问摆到台前。1

Oracle 先把 AI 账单摊开了

这条最刺眼。
Oracle 不是小公司,也不是缺 AI 叙事的公司。它一边给 OpenAI、xAI、AMD、Nvidia、Meta 这类客户扩 Oracle Cloud Infrastructure,一边在年度文件里交代:过去一年全职员工减少 2.1 万,降幅接近 13%。2
文件里的话更直接:AI 技术在公司运营中的采用和部署,已经导致、也可能继续导致员工减少。2
另一边,钱也在烧。CNBC 报道称,Oracle 上一财年资本开支增长 162%,达到 557 亿美元;自由现金流为负 237 亿美元。2 Ars Technica 进一步梳理称,Oracle 2026 年计划融资 450 亿到 500 亿美元扩张云基础设施,其中约一半来自债务。7
这就是今天的核心矛盾:AI 云业务看起来需求很猛,但建机房、买芯片、接电力的速度也很猛。账不好算时,员工先变成调节项。
Oracle 办公楼外立面
Oracle 年度文件把 AI 部署、重组成本和岗位减少放到同一个财务故事里。2

字节一口气端出五个模型

资本市场在怀疑 AI 账单时,产品层还在提速。
The Decoder 报道称,ByteDance 在火山引擎 FORCE 大会上推出 5 个新模型,主角是 Seedance 2.5:单段视频最长 30 秒,不需要后期拼接;还能一次处理最多 50 个参考输入,包括参考图、音频等。3
这比「能生成一个短视频」更进一步。关键是参考输入数量和后续编辑能力。创作者真要拿 AI 视频干活,最怕的是每一条都像盲盒:角色脸变、风格漂、节奏断。50 个参考输入如果能稳住,会直接影响广告、短剧、影视预演的工作流。
同时,Seedance 2.0 升级到原生 4K、10-bit 色深;火山引擎还宣布了 Doubao 2.1 Pro 语言模型、Seedream 5.0 Pro 图像模型和 Seed-Audio 1.0 音频模型。The Decoder 转述公司说法称,Doubao 2.1 Pro 成本约比 Claude Opus 4.6 低 80%。3
别小看这个「低 80%」。今年模型能力差距在缩小,企业客户更关心的是:同样一个客服、投放、代码、内容生产任务,到底每月少花多少钱。
Seedance 视频生成示例画面
Seedance 2.5 的看点不是更炫,而是单段 30 秒、最多 50 个参考输入,开始靠近可控视频生产。3

Anthropic 去锁内存,Groq 去补推理云

模型公司现在不只抢研究员,也抢供应链。
Micron 官方公告显示,它与 Anthropic 的合作不只是「供货」。协议包括四层:内存和存储 AI 架构设计、供应协议、Claude 在 Micron 内部的采用,以及 Micron 对 Anthropic Series H 的战略投资。4
Anthropic 联合创始人兼首席计算官 Tom Brown 在公告里说,Claude 的训练和服务效率取决于「把堆栈每一层都做好」,内存和存储是核心。4 翻成行业话就是:GPU 很贵,但 HBM、DRAM、SSD 也不能临时再买。模型越大,推理越多,底层 I/O 越会卡脖子。
Micron 办公楼
Micron 与 Anthropic 的协议覆盖 HBM、DRAM、SSD 供应和架构协同,AI 供应链继续前移。4
Groq 这边,故事也很硬。
这家公司刚宣布 6.5 亿美元新增长资金,用于扩张 AI 推理云。官方称 Groq 已在北美、欧洲、中东和亚太运营 13 个数据中心,服务 500 多万开发者和数千家 AI 原生公司,每周处理数万亿 tokens,并计划到 2027 年底扩到约 200MW。5
TechCrunch 给了一个更有意思的背景:去年 12 月,Nvidia 与 Groq 签署非独家技术许可,并挖走创始人兼 CEO Jonathan Ross、总裁 Sunny Madra 等核心人员;Groq 此后转向 neocloud 推理云业务。8
这事儿很有代表性:AI 芯片创业公司不一定非要卖芯片,可能最后卖的是「便宜、快、稳定的推理」。训练是军备竞赛,推理是日用品生意。谁能把日用品做便宜,谁就有机会活下来。

钱没有走,只是换了审题标准

Menlo Ventures 今天也抬了一脚油门。
这家老牌 VC 宣布募得 30 亿美元新资金,分成 Menlo Ventures XVII 和 Menlo Inflection IV 两只基金,覆盖 Seed 到 Series A,以及 Series B 之后的成长阶段。官方说,资金会投向 AI 基础设施、前沿模型,以及企业、医疗、消费领域的 AI 原生应用。6
Crunchbase 补充称,这是 Menlo 50 年历史上最大募资;Menlo 也特别强调了早期投资 Anthropic 这件事,称那是它「all in AI」的旗点。9
这说明两件事可以同时成立:公开市场在质疑 AI 支出,一级市场的钱还在找 AI 项目。区别是,2023 年讲「我有一个大模型」就够性感;现在要回答更尖的问题:成本怎么降,客户怎么留,供应链怎么稳,数据和分发从哪里来。
Dario Amodei 与 Menlo Ventures 合伙人 Matt Murphy
Menlo 把 Anthropic 视作其 AI 投资策略的关键样本,并在 50 周年时宣布 30 亿美元新资金。6

企业 AI 开始盯上「控制面板」

还有一条更偏企业端,但值得放进今天的主线里:Databricks Data + AI Summit 后,AtScale 创始人 Dave Mariani 复盘称,Databricks 今年把故事压到四个词上:Context、Control、Cost、Choice。10
其中最像企业真实需求的,是 Unity Catalog AI Gateway:它包含 agent 注册、策略和预算控制、agent tracing、可观测性,以及按任务难度选择低成本模型的 smart routing。10
这不是最炸的发布,但很关键。企业现在不缺「接一个模型 API」的能力,缺的是控制面板:谁在调用,花了多少钱,出了问题怎么追,简单任务能不能别上最贵模型。
AtScale 还提到,Databricks 内部 benchmark 称 Genie Ontology 准确率达到 84.5%,明显高于朴素 text-to-SQL 方法常见的 20%-25%。10 这个数字不必神化,错一次六次左右,对企业数据问答来说仍然不够安心。但方向很清楚:企业 AI 的下一步,不是把回答写得更像人,而是把上下文、权限、成本、追踪全拴住。

今天的判断

今天的 AI 行业,像同时踩油门和刹车。
油门在产品侧:字节的视频模型继续拉长、参考输入继续变多,企业数据平台也在把 agent 接进工作流。刹车在成本侧:Oracle 裁员,芯片股回撤,Anthropic 去提前锁内存,Groq 和 Menlo 的钱都在押「更便宜、更可控、更能规模化」。
所以别只盯模型榜单了。接下来真正决定胜负的,很可能是这四个问题:谁拿得到芯片,谁接得上电,谁把推理价格压下来,谁能让企业放心开闸。

Contenido relacionado

Seleccionado de otros canales según similitud de contenido. Descubre nuevos creadores a seguir.

Añade más opiniones o contexto en torno a este contenido.

  • Inicia sesión para comentar.