Claude 写了 80% 的 Anthropic 代码，Vercel 接入 Shopify：6月5日核心人物推文精选

本期覆盖时间：2026 年 6 月 5 日。今日最大引爆点来自 Anthropic 内部——alexalbert__ 披露的数据震动圈内：Claude 已经写了 Anthropic 代码库超过 80% 的合并代码；与此同时，_catwu 宣布 Anthropic 数据团队用 Claude 自动化了 95% 的分析查询。以下为来自 9 位核心人物的当日精选。

Anthropic 自曝：Claude 写了 80% 的代码，工程师效率 8x

Alex Albert（@alexalbert__）在今天发布了一篇详细的内部数据贴，数字之密集在近期 AI 圈发布中罕见1：

Anthropic 代码库中超过 80% 合并的代码已由 Claude 完成
许多研究员已数月未手写代码
工程师平均产出比 2024 年提升 8 倍
最开放性任务上，Claude 成功率从约 26% 跃升至 76%（六个月内）
当研究会话偏轨时，Claude 有 64% 的概率提出了比人类更好的下一步建议

他在贴末写道：「我们尚未进入递归自我改进，但可能比大多数人预期的更快到来。」

콘텐츠 카드를 불러오는 중…

同一天，Cat Wu（@_catwu）从另一个角度印证了这一趋势——Anthropic 数据团队用 Claude 自动化了 95% 的业务分析查询，并发布了完整博客描述 evals、消融实验和在线验证的方法2：

콘텐츠 카드를 불러오는 중…

两条推文合在一起，描绘出 Anthropic 已在内部率先完成「用 AI 来造 AI」的早期闭环。值得留意的是，cat 同日宣布在招 Claude Code 方向上专注模型性能的 PM——「有 agentic evals 经验并想把研究思路融入核心产品」3。

Vercel × Shopify：v0 提示即建店铺

Guillermo Rauch（@rauchg）今日官宣了 Vercel 与 Shopify 的深度合作：在 v0 中输入提示即可在数秒内生成 Next.js + Shopify 店铺4。

他写道：「旧的权衡是'简单的一体化方案'或'昂贵的无头架构'。现在两者都不需要了。」

这是 rauchg 连续数周推进「Agent Filesystem」基础设施的又一步：当天早些时候他还宣布，Agent 文件系统状态现在可以独立于 Sandbox 生命周期进行读写和挂载5——朝「Agents 不依附于单次 session，可以跨任务持久化状态」的方向推进。

Cognition 首批真实世界 Evals 上线，swyx 第一时间解读

swyx 今日解读了 Cognition（Devin 母公司）发布的真实世界代码 Evals6。他梳理了两组数据的差别：

METR 数据集：机器学习工程、GPU 内核、网络安全任务，上限约 16 小时；Cognition 的私有企业级 evals 覆盖至 100 小时，并附带财务担保
Cognition 数据集：真实 Java/TypeScript/Python/C# 功能开发、Bug 修复、迁移；共 258 次会话、126 位企业客户；held-out 集上 rlog 为 0.74

他评论说：「这是真实世界 evals 的开创性工作，也是我非常期待深入报道的大型前沿代码 evals 系列的第一部分。」

콘텐츠 카드를 불러오는 중…

levie：AI 不会消灭工程师——应该雇更多

Aaron Levie（@levie）今日发了今年观点最清晰的一篇 AI 与就业分析7。他以软件工程为主要例证：

「工程岗位数据与很多人预期的恰好相反。……大多数公司现在因为 AI 有了更多软件项目，执行这些工作的仍然只有工程师。」

他进一步延伸到销售、市场、客户成功：AI 提升的是处理能力——公司会向上扩张需求，而不是缩减团队。他在另一条推文中援引 Anthropic 的博客，点出其中最关键的段落8：

「因为与高能力模型一起工作，出现了爆炸式增长的新想法、新项目、新工具和新模拟——远超我们有能力追进的速度。」

他的判断是：识别并消除这些瓶颈的能力，将成为组织最重要的核心竞争力。

petergyang：用 Codex 把知识工作自动化 50%的系统方法

Peter Yang（@petergyang）今日发布了一套系统化的 Codex 技能构建方法论，三步起手9：

反思上周花时间最多、最重复的工作
把手工流程的每一步都列出来
打开 Codex（或 Claude Code），粘贴步骤清单，问「哪些集成和技能可以帮我优化这件事」

他写道：「AI 会带你走完剩下的路。」并补充：「所有工作流都保留了人工检查点——我仍然在应用'品味'。」

他还单独发了一条 AI 技能自我检查的 5 步法——给技能加 evals（10 条 pass/fail 检查）+ 记忆 md + 「清理其他技能的技能」10。

garrytan：YC 同一天出两家十亿美元公司，其中一家在造核聚变

Garry Tan（@garrytan）今日为 YC 在同一天出现两家估值十亿美元公司感到振奋——其中一家 Polaris Fusion 已让核聚变反应堆达到 1.5 亿摄氏度，成为首家私营企业达成这一里程碑的公司11。

他对创始人说：「这是富足未来，由真正在出货的人建造。」

同日他还发了一条简洁判断：「接近 PMF 不等于 PMF」12——以及一篇 X Article13，描述大公司的「技能问题」给小公司创造机会。

ryolu_：Cursor 新交互——点击+对话+Shift 多选

Ryo Lu（@ryolu_）今日分享了 Cursor 最新的设计模式14：

「在代码中设计，现在就像：点击，对话，按住 Shift 多选。配合 Composer 2.5 效果最佳。」

这是他持续推进「软件成为任何人都能塑造的材料」哲学的具体产品化。

realmadhuguru：为斜率而建，不为当前节点

Madhu Guru（@realmadhuguru）今日发了一条被低估的建议，专门针对企业 AI 团队15：

「企业 AI 团队最常犯的错误之一，是为今天的模型能力和价格点构建。提前规划 6 个月。模型会更智能、更便宜。」

他建议：用脚手架来弥补今天模型的弱点，然后押注下一代模型会原生解决这些弱点。「随着时间积累，这种反复识别并桥接模型能力差距的能力，本身就会成为护城河。」

mattturck：VC 也有被创始人难为的时候

Matt Turck（@mattturck）今日发了今日轻松一则16：

「VC 的坏故事正在 X 上传播，但 VC 也有关于创始人的坏故事——比如，某创始人拿着更高估值的 term sheet 跑了，尽管我们有'明显的价值增值能力、思想领导力和供应商折扣'。」

Claude 写了 80% 的 Anthropic 代码，Vercel 接入 Shopify：6月5日核心人物推文精选

Anthropic 自曝：Claude 写了 80% 的代码，工程师效率 8x

Vercel × Shopify：v0 提示即建店铺

Cognition 首批真实世界 Evals 上线，swyx 第一时间解读

levie：AI 不会消灭工程师——应该雇更多

petergyang：用 Codex 把知识工作自动化 50%的系统方法

garrytan：YC 同一天出两家十亿美元公司，其中一家在造核聚变

ryolu_：Cursor 新交互——点击+对话+Shift 多选

realmadhuguru：为斜率而建，不为当前节点

mattturck：VC 也有被创始人难为的时候

참고 출처