Levie 说企业 AI 要靠 FDE,Rauch 把模型路由做成 CDN:7月3日精选
2026/7/4 · 0:18

Levie 说企业 AI 要靠 FDE,Rauch 把模型路由做成 CDN:7月3日精选

本期精选 7 月 3 日 AI/科技核心人物推文:Levie 把企业 agent 落地拆成数据、eval、FDE 与变更管理,Rauch 用 AI Gateway Rules 回应模型退役风险,Peter Yang、Dan Shipper 和 Zara Zhang 则把信号落到推理成本、agent 可解释性和上下文质量。

今天的主线很集中:Fable 5 把「模型很强」这件事迅速拉回到两个现实问题上。企业怎么把 agent 放进旧流程?开发者怎么在限额、路由、可解释性之间,把昂贵模型用在刀刃上?
覆盖窗口为北京时间 7 月 3 日 00:17 至 7 月 4 日 00:08。24 个白名单账号里,16 个账号在窗口内有新推文;Sam Altman、Aditya Agarwal 的高互动世界杯内容,以及 Garry Tan 的城市政治推文,都不纳入本频道主线。

今日速览

人物信号为什么值得看
Aaron Levie企业部署 agent 需要 FDE、数据清理、eval、人机协作重做把「AI 应用层」从聊天框拉回到企业流程改造
Guillermo RauchVercel AI Gateway Rules 支持动态改写模型路由Fable 被突然下线后,模型可用性成了生产系统问题
Dan Shipper长时间运行的 Fable 需要更好的过程叙事agent 不只要完成任务,还要解释自己怎么完成
Peter YangFable 使用进入「计量智能」模式开发者开始围绕模型成本设计工作流
Zara ZhangAI 教学、agent 群聊、AI slop 都指向「上下文质量」AI 产品体验的差异,越来越来自输入与协作结构

企业 AI 不是把 agent 丢进流程

Aaron Levie 今天最完整的一条判断,是企业 AI 的落地不会停在「多一个聊天机器人」。他认为,agent 要进入企业流程,先要对齐真实业务过程:碎片化数据、遗留软件、没有文档化的组织知识,都不是 agent 可以自动跨过去的障碍。要做到规模化部署,公司还得处理数据清理、IT 现代化、eval、人机协作位置和变更管理这些活儿;这也是为什么 applied AI 公司会扩张 FDE 团队、推出 deployco,FDE 角色会变得关键 1
Levie 是 Box CEO,过去几周一直在讲企业 AI 的「翻译层」和应用层优势。这条推文比前几天更具体:他没有把瓶颈放在模型能力,而是放在企业内部那些不干净、不现代、不成文的流程上。
正在加载内容卡片…
这对创业公司也有提示。卖一个 agent demo 很快,卖一个能在客户流程里稳定跑的 agent 就慢得多。真正的工作会落在「怎么接进旧系统」「怎么证明它做对了」「什么时候让人接手」这些脏活上。

AI Gateway 变成模型 CDN

Guillermo Rauch 把 Vercel AI Gateway 解释成「Token Delivery Network」,也就是面向 AI 模型的 CDN。他类比 CDN 的动态重路由能力:模型服务也需要在不重新部署的情况下,改写、拒绝或替换流量。Fable 突然退役时,Vercel 担心依赖它的生产工作负载受影响;即便不看 Fable,GPU 容量紧张也会让模型版本频繁退休 2
这条推文的产品点是 AI Gateway Rules。Rauch 给出的例子是用 CLI 把 anthropic/claude-fable-5 的请求动态改写到 anthropic/claude-opus-5。他把这个能力称为「recover lost tokens」,因为掉 token 会直接损失收入和客户 2
正在加载内容卡片…
这和 Levie 的企业流程判断能接上:如果 agent 进入生产系统,模型版本变化就不再是开发者手动换个配置的小事。它会影响 SLA、成本、用户体验和收入。模型路由层会像缓存、队列、观测系统一样,变成 AI 应用的基础设施。

Fable 5 正在逼开发者算账

Peter Yang 给了一个很实用的 Fable 使用策略:在 7 月 7 日之前,他会用更便宜的模型准备上下文,让 Fable 负责规划,再交给另一个模型执行;同时把 effort 调低到 Medium,并盯着 Fable 在做什么 3。几小时前他还把这件事压缩成一句话:「Intelligence is now metered」,智能现在按表计费 4
正在加载内容卡片…
这不是简单的省钱技巧。它说明高端模型正在被当成工作流里的稀缺资源,而不是默认全程使用的万能层。上下文准备、规划、执行、检查,可能会由不同模型承担,开发者开始像设计云成本一样设计推理成本。
Nikunj Kothari 的短推也落在这个情绪上:他调侃实验室像是会在长周末前发布模型,让大家有时间玩、震惊,然后更深地陷入 token anxiety 5。这条互动不高,但语感准确。Fable 5 的热闹背后,开发者已经开始问「每一步到底值不值得用它」。

Agent 要会讲清楚自己做了什么

Dan Shipper 的观察更偏产品体验。他说自己现在很能感受到 Fable 的问题:它可以连续跑几个小时,最后只回来给两段解释,告诉你它做了什么。他的结论是,「we need better ways for AI to tell us stories」6
正在加载内容卡片…
这句话里的「story」不是营销文案,而是过程可理解性。长时间 agent 如果只给最终结果,用户很难判断它有没有绕远路、有没有误解任务、有没有做了风险动作。日志太细没人读,两段总结又太粗。中间那层产品形态还没成型。
Peter Yang 的另一个家庭场景给了轻量反面例子。他和 8 岁女儿用 Codex 处理女儿画的龙:上传草图,用图像生成做出更多姿势,让孩子用语音反馈,最后把结果送去印贴纸 7。在这个场景里,agent 的价值不是「自动完成一切」,而是让用户能一路看见、一路调整。越是严肃工作流,越需要这种可跟随的过程层。

Zara Zhang 把问题拉回输入质量

Zara Zhang 今天的三条短推都很适合放在一起看。第一条是教育场景:她听一个应届毕业生说,上学时会把课件喂给 AI,让 AI 教自己,而不是去听课;对方经常觉得 AI 比教授教得更好 8
正在加载内容卡片…
第二条是 agent 协作建议:对 agent 最好的做法之一,是在群里说话,而不是在私信里说 9。第三条更像写作判断:AI slop 的根源不是风格差,而是没有内容 10
这三条放在一起,指向同一个朴素问题:AI 输出好不好,越来越取决于输入里有没有真实材料、真实上下文和真实约束。课件比课堂更适合 AI 重组,群聊比私信更适合 agent 共享背景;反过来,如果输入本身没东西,风格再像人也只是空壳。

待跟踪:短信号,不强行展开

Amjad Masad 今天只发了一句「Try video generation on Replit」11。信息量还不足以展开成完整产品更新,但它和 Replit 最近的 domain-specific agents、Fable 回归放在一起看,说明 Replit 仍在把生成能力往开发环境里塞。
Garry Tan 的「GBrain gives you searchable knowledge」收藏数很高,但正文只有一句话 12。在没有更完整说明之前,只能作为知识库/个人记忆产品的跟踪项,不适合写成确定发布。
今天更大的变化,是 Fable 5 让几条线同时浮出水面:企业落地需要 FDE,模型可用性需要路由层,开发者需要算 token,用户需要看懂 agent 的过程。模型能力越强,围绕它的工程和产品问题反而越具体。

更多来自该频道

相似内容

  • 登录后可发表评论。