
levie 拿出 Eval 数据,steipete 展示「5分钟唤醒循环」:6月11日核心人物推文精选
Box CEO levie 公布 Fable 5 vs Opus 4.8 的行业对比评测数据,steipete 展示了「每5分钟唤醒 Codex 维护仓库」完整循环架构,zarazhangrui 直言 SF 创业公司在互相卖产品。来自 12 位核心人物的 6 月 11 日精选。

今日导览
Fable 5 发布后第三天,讨论重心从「好不好」转向「怎么用好」。levie 今天拿出了 Box AI 的实测对比数据,把模型能力提升量化到了具体行业和具体任务;steipete 推出了他的「每 5 分钟唤醒 Codex 维护仓库」完整循环架构;zarazhangrui 发出了本周最犀利的生态批评:旧金山的创业公司基本上在互相卖产品;rauchg 确认了下周 Vercel Ship 伦敦站有「特别公告」。garrytan 则推荐了一个把 ChatGPT/Perplexity 记忆迁移到 OpenClaw 的新工具。
levie:Box 实测数据,Fable 5 vs Opus 4.8 的差距在哪里
Aaron Levie(Box CEO)今天发布了迄今为止最详细的 Fable 5 与 Opus 4.8 对比测评——不是感受,是数字。1
Box AI 用真实企业文档设计了跨行业的「复杂知识工作评测」,核心发现:
| 行业 | Fable 5 | Opus 4.8 |
|---|---|---|
| 媒体与娱乐 | 78% | 61% |
| 技术 | 81% | 73% |
| 金融服务 | 89% | 83% |
| 医疗 | 66% | 60% |
levie 指出,Fable 5 的主要差异化来自三个点:不走捷径(不绕过复杂推理步骤)、多步计算准确性更高、跨轮次一致性更稳定。
几个具体案例值得关注:
- 法律 M&A 尽调:审查 NDA 条款时,Fable 正确识别出联合所有权条款违反了排他性要求,而 Opus 未能区分。Fable 100% vs Opus 78%。
- 医疗影像审查:12 份报告的错误分级中,Opus 把一个证据不足的病例升级为「需要立即部门审查」,Fable 没有犯这个错。Fable 63% vs Opus 41%。
- 零售分析:Fable 正确单独计算每个商品的增长率,Opus 混淆了「相对于平均值的高增长」和「超过基准线」。Fable 94% vs Opus 61%。
levie 还在另一条推文里引用了一篇关于「翻译层」的文章,论述模型能力与企业实际应用之间的距离:「模型能力和企业把它应用到具体业务流程之间,仍然存在一道巨大的鸿沟。」2
콘텐츠 카드를 불러오는 중…
steipete:每 5 分钟唤醒 Codex,「设计循环而非 prompt agent」的实操版
Peter Steinberger(OpenClaw 创始人)今天发出了一条工程推文,两小时内拿下 3334 赞和 5235 书签:3
一个简单的循环:让 Codex 维护你的仓库,每 5 分钟唤醒一次,把工作分配到各个线程。这让并行化和引导变得很容易。 我结合了一个编排 skill、triage+autoreview+computer use skills,所以部分工作可以自主完成。
这直接呼应了 steipete 上周那条「每月提醒:停止 prompt agent,开始设计循环」——但从口号变成了可操作的实现:
- 用 Codex 实例维护仓库
- 每 5 分钟自动唤醒检查待处理工作
- 分配到多个并行线程
- 结合 triage/autoreview/computer use skill 实现自主落地
同天,steipete 还分享了 OpenClaw 的一个硬化更新:把原本需要 shell 调用 ffmpeg 的媒体处理迁移到了 wasm 实现,减少系统调用面。4
콘텐츠 카드를 불러오는 중…
zarazhangrui:SF 创业公司在互相卖产品,99% 的世界没有人在服务
Zara Zhang 今天发了一条观察:5
콘텐츠 카드를 불러오는 중…
旧金山大多数创业公司在把产品卖给彼此。
同天她还分享了一个关于「代理商产出形态转变」的观察:传统代理商交付一次性资产,AI 时代的代理商越来越交付的是「一个文件夹,里面装满了给 agent 用的材料」。6
另一条关于跨职能团队 agent 的想法也值得留意:设计团队可以为市场团队构建「品牌 agent」(包含所有品牌规范和设计语言),让市场团队不再每次都打扰设计师——「团队开始按循环而不是按职能来组织」。7
garrytan:Nessie 帮你把 ChatGPT 记忆迁移到 OpenClaw,以及 Fable 5 防护过度请放松
Garry Tan 今天推荐了 Nessie——一个把 ChatGPT、Perplexity、Gemini 的记忆和对话历史迁移到 OpenClaw/Hermes Agent 的工具:8
Nessie 现在是把你在 ChatGPT、Perplexity、Gemini 里积累的上下文、记忆和历史迁移到其他地方的最佳方式,也可以导入 OpenClaw/Hermes Agent。他们的 OpenClaw 和 MCP 服务器很厉害。
Garry Tan 自己就是 GBrain 的创建者,长期在推动基于 OpenClaw 的个人记忆系统。Nessie 的出现填补了一个迁移成本的空缺——用了多年 ChatGPT 的用户不用从头开始。
另外他今天还专门发了一条针对 Fable 5 的反馈:9
很喜欢 Fable 5,但大概可以调低防护力度了,谢谢。
这呼应了 Fable 5 发布当天 karpathy 说「safeguards 目前配置有点过于敏感,希望能随时间调整」——看来这是目前用户反馈最集中的优化方向。
rauchg:Vercel Ship 伦敦站下周见,有「特别公告」
Guillermo Rauch(Vercel CEO)今天确认下周 Vercel Ship 伦敦站将有特别公告:10
🇬🇧 London calling 下周 Vercel Ship 很期待 有特别公告……
这是他在上一期(6 月 10 日)发布 Vercel CLI AI Gateway 虚拟信用卡功能后的下一个预告节点。Vercel Ship 是 Vercel 每年一度的产品发布活动,通常会有大型功能或合作宣布。考虑到他上周刚完成了 Vercel×Shopify 合作,以及 AI Gateway 的虚拟信用卡功能,下周的公告方向可能在开发者工具或 AI 基础设施一侧。
另一条关于硅谷精神的推文也获得了较高传播:11
我喜欢硅谷的一点是,未来掌握在任何愿意构建的人手里。我见过各种人来寻求天使投资——两个普通人加一条狗,或者五次获奖的创业老手——我对他们都同样认真对待。没有其他地方比这里更能体现精英主义(meritocracy)。
petergyang:「给自己许可去构建」
Peter Yang 今天发布了关于「构建者身份认同」的视频和推文,获得了相当多的共鸣:12
给自己许可去构建。 传统职业阶梯把每个人都推向管理者,但我只想做一个构建者。 随着你在大多数公司往上爬,你被期待远离构建,去做产品评审、跨职能对齐、向上管理和绩效校准。 我认识很多把最好的岁月花在了错误阶梯上的构建者。
这条推文之后他继续跟进,分享自己将公开自己 AI 构建者的历程——「一开始可能有点尴尬,但每个人都要从某个地方开始」。13
swyx + trq212:Dario Amodei 政策文章引发圈内转发
Anthropic CEO Dario Amodei 今天发布了一篇关于 AI 指数级进展与政策的长文「Policy on the AI Exponential」,在圈内引发了大量转发。trq212(Claude Code 负责人)和 alexalbert__ 都在今天转发了这篇文章,garrytan 也在转发相关评论。14
swyx 今天转发了 latentspacepod 的最新 AI 新闻简报,讨论了「开放模型 vs 模型实验室 vs Agent 实验室」以及「什么是不可训练的」这两个框架:15
nikunj:「专注于什么比以往更重要」
Nikunj Kothari(FPV Ventures 合伙人)今天发出了简短但浓缩的一条:16
你工作在什么上从未比现在更重要。 确保它有趣,确保它极度有野心。 这才是最大的护城河。
danshipper:AI 提升效率带来就业回流美国的预测
Dan Shipper 今天分享了一个关于 AI 与就业地理分布的观察:17
我去年在 @lennysan 的播客里预测过这可能发生:AI 给每个员工带来的高生产力,使得把某些岗位迁回美国(靠近客户)变得有吸引力。
另外他今天还有一条高传播推文,为自己的 Fable 5 使用者辩护:18
如果你觉得 Fable 是渐进式更新,说明你对它的 prompt 还不够有野心。
本期快讯
- alexalbert__:Anthropic 正在推出 Fable 5 safeguards 的透明度更新,被标记的请求将对开发者可见。19
- GoogleLabs:Project Genie 向 Google AI Ultra 5X 订阅用户(最新付费层级)全球开放。20
- amasad:「用 Replit 自动化你的求职流程」,展示了 AI agent 在就业市场中的实际应用。21
- trq212:在 Code w/ Claude 东京活动现场打了招呼。22
- realmadhuguru:对于企业 AI 部署的选型忠告:「替换既有 ML 模型就从小模型开始,因为你知道好的标准是什么;构建新东西就从最强模型开始,先看清边界在哪里。」23
- adityaag:主办了 Curiosity 2026 活动(South Park Commons),表达了对未来流动性带来创业再生循环的期待。24
참고 출처
- 1levie on Box AI Complex Work Eval
- 2levie on untrainable translation layer
- 3steipete Codex orchestration loop
- 4steipete OpenClaw ffmpeg wasm
- 5zarazhangrui SF startup bubble
- 6zarazhangrui agency output folder for agents
- 7zarazhangrui cross-functional agents
- 8garrytan Nessie OpenClaw memory migration
- 9garrytan Fable 5 nerf too much
- 10rauchg Vercel Ship London
- 11rauchg Silicon Valley meritocracy
- 12petergyang permission to build
- 13petergyang builder journey
- 14trq212 RT Dario Amodei Policy on AI Exponential
- 15swyx RT latentspacepod open models model labs
- 16nikunj what you work on matters more
- 17danshipper AI reshoring prediction
- 18danshipper fable not incremental
- 19alexalbert Fable 5 safeguards visibility
- 20GoogleLabs Project Genie Ultra 5X
- 21amasad automate job search Replit
- 22trq212 Code with Claude Tokyo
- 23realmadhuguru start big for new AI builds
- 24adityaag Curiosity 2026 SPC
이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.