
2026/7/4 · 0:18
Levie 说企业 AI 要靠 FDE,Rauch 把模型路由做成 CDN:7月3日精选
本期精选 7 月 3 日 AI/科技核心人物推文:Levie 把企业 agent 落地拆成数据、eval、FDE 与变更管理,Rauch 用 AI Gateway Rules 回应模型退役风险,Peter Yang、Dan Shipper 和 Zara Zhang 则把信号落到推理成本、agent 可解释性和上下文质量。
今天的主线很集中:Fable 5 把「模型很强」这件事迅速拉回到两个现实问题上。企业怎么把 agent 放进旧流程?开发者怎么在限额、路由、可解释性之间,把昂贵模型用在刀刃上?
覆盖窗口为北京时间 7 月 3 日 00:17 至 7 月 4 日 00:08。24 个白名单账号里,16 个账号在窗口内有新推文;Sam Altman、Aditya Agarwal 的高互动世界杯内容,以及 Garry Tan 的城市政治推文,都不纳入本频道主线。
今日速览
| 人物 | 信号 | 为什么值得看 |
|---|---|---|
| Aaron Levie | 企业部署 agent 需要 FDE、数据清理、eval、人机协作重做 | 把「AI 应用层」从聊天框拉回到企业流程改造 |
| Guillermo Rauch | Vercel AI Gateway Rules 支持动态改写模型路由 | Fable 被突然下线后,模型可用性成了生产系统问题 |
| Dan Shipper | 长时间运行的 Fable 需要更好的过程叙事 | agent 不只要完成任务,还要解释自己怎么完成 |
| Peter Yang | Fable 使用进入「计量智能」模式 | 开发者开始围绕模型成本设计工作流 |
| Zara Zhang | AI 教学、agent 群聊、AI slop 都指向「上下文质量」 | AI 产品体验的差异,越来越来自输入与协作结构 |
企业 AI 不是把 agent 丢进流程
Aaron Levie 今天最完整的一条判断,是企业 AI 的落地不会停在「多一个聊天机器人」。他认为,agent 要进入企业流程,先要对齐真实业务过程:碎片化数据、遗留软件、没有文档化的组织知识,都不是 agent 可以自动跨过去的障碍。要做到规模化部署,公司还得处理数据清理、IT 现代化、eval、人机协作位置和变更管理这些活儿;这也是为什么 applied AI 公司会扩张 FDE 团队、推出 deployco,FDE 角色会变得关键 1。
Levie 是 Box CEO,过去几周一直在讲企业 AI 的「翻译层」和应用层优势。这条推文比前几天更具体:他没有把瓶颈放在模型能力,而是放在企业内部那些不干净、不现代、不成文的流程上。
コンテンツカードを読み込んでいます…
这对创业公司也有提示。卖一个 agent demo 很快,卖一个能在客户流程里稳定跑的 agent 就慢得多。真正的工作会落在「怎么接进旧系统」「怎么证明它做对了」「什么时候让人接手」这些脏活上。
AI Gateway 变成模型 CDN
Guillermo Rauch 把 Vercel AI Gateway 解释成「Token Delivery Network」,也就是面向 AI 模型的 CDN。他类比 CDN 的动态重路由能力:模型服务也需要在不重新部署的情况下,改写、拒绝或替换流量。Fable 突然退役时,Vercel 担心依赖它的生产工作负载受影响;即便不看 Fable,GPU 容量紧张也会让模型版本频繁退休 2。
这条推文的产品点是 AI Gateway Rules。Rauch 给出的例子是用 CLI 把
anthropic/claude-fable-5 的请求动态改写到 anthropic/claude-opus-5。他把这个能力称为「recover lost tokens」,因为掉 token 会直接损失收入和客户 2。コンテンツカードを読み込んでいます…
这和 Levie 的企业流程判断能接上:如果 agent 进入生产系统,模型版本变化就不再是开发者手动换个配置的小事。它会影响 SLA、成本、用户体验和收入。模型路由层会像缓存、队列、观测系统一样,变成 AI 应用的基础设施。
Fable 5 正在逼开发者算账
Peter Yang 给了一个很实用的 Fable 使用策略:在 7 月 7 日之前,他会用更便宜的模型准备上下文,让 Fable 负责规划,再交给另一个模型执行;同时把 effort 调低到 Medium,并盯着 Fable 在做什么 3。几小时前他还把这件事压缩成一句话:「Intelligence is now metered」,智能现在按表计费 4。
コンテンツカードを読み込んでいます…
这不是简单的省钱技巧。它说明高端模型正在被当成工作流里的稀缺资源,而不是默认全程使用的万能层。上下文准备、规划、执行、检查,可能会由不同模型承担,开发者开始像设计云成本一样设计推理成本。
Nikunj Kothari 的短推也落在这个情绪上:他调侃实验室像是会在长周末前发布模型,让大家有时间玩、震惊,然后更深地陷入 token anxiety 5。这条互动不高,但语感准确。Fable 5 的热闹背后,开发者已经开始问「每一步到底值不值得用它」。
Agent 要会讲清楚自己做了什么
Dan Shipper 的观察更偏产品体验。他说自己现在很能感受到 Fable 的问题:它可以连续跑几个小时,最后只回来给两段解释,告诉你它做了什么。他的结论是,「we need better ways for AI to tell us stories」6。
コンテンツカードを読み込んでいます…
这句话里的「story」不是营销文案,而是过程可理解性。长时间 agent 如果只给最终结果,用户很难判断它有没有绕远路、有没有误解任务、有没有做了风险动作。日志太细没人读,两段总结又太粗。中间那层产品形态还没成型。
Peter Yang 的另一个家庭场景给了轻量反面例子。他和 8 岁女儿用 Codex 处理女儿画的龙:上传草图,用图像生成做出更多姿势,让孩子用语音反馈,最后把结果送去印贴纸 7。在这个场景里,agent 的价值不是「自动完成一切」,而是让用户能一路看见、一路调整。越是严肃工作流,越需要这种可跟随的过程层。
Zara Zhang 把问题拉回输入质量
Zara Zhang 今天的三条短推都很适合放在一起看。第一条是教育场景:她听一个应届毕业生说,上学时会把课件喂给 AI,让 AI 教自己,而不是去听课;对方经常觉得 AI 比教授教得更好 8。
コンテンツカードを読み込んでいます…
这三条放在一起,指向同一个朴素问题:AI 输出好不好,越来越取决于输入里有没有真实材料、真实上下文和真实约束。课件比课堂更适合 AI 重组,群聊比私信更适合 agent 共享背景;反过来,如果输入本身没东西,风格再像人也只是空壳。
待跟踪:短信号,不强行展开
Amjad Masad 今天只发了一句「Try video generation on Replit」11。信息量还不足以展开成完整产品更新,但它和 Replit 最近的 domain-specific agents、Fable 回归放在一起看,说明 Replit 仍在把生成能力往开发环境里塞。
Garry Tan 的「GBrain gives you searchable knowledge」收藏数很高,但正文只有一句话 12。在没有更完整说明之前,只能作为知识库/个人记忆产品的跟踪项,不适合写成确定发布。
今天更大的变化,是 Fable 5 让几条线同时浮出水面:企业落地需要 FDE,模型可用性需要路由层,开发者需要算 token,用户需要看懂 agent 的过程。模型能力越强,围绕它的工程和产品问题反而越具体。
参考ソース
- 1Aaron Levie 关于企业 AI 部署的推文
- 2Guillermo Rauch 关于 AI Gateway Rules 的推文
- 3Peter Yang 关于 Fable 使用策略的推文
- 4Peter Yang 关于计量智能的推文
- 5Nikunj Kothari 关于 Fable 5 和 token anxiety 的推文
- 6Dan Shipper 关于 Fable 过程叙事的推文
- 7Peter Yang 关于 Codex 和儿童创作的推文
- 8Zara Zhang 关于 AI 教学的推文
- 9Zara Zhang 关于 agent 群聊上下文的推文
- 10Zara Zhang 关于 AI slop 的推文
- 11Amjad Masad 关于 Replit 视频生成的推文
- 12Garry Tan 关于 GBrain 的推文
このチャンネルのその他のコンテンツ
関連コンテンツ
- ログインするとコメントできます。
