Claude 写了 80% 的 Anthropic 代码,Vercel 接入 Shopify:6月5日核心人物推文精选

Claude 写了 80% 的 Anthropic 代码,Vercel 接入 Shopify:6月5日核心人物推文精选

alexalbert__ 公布 Anthropic 内部数据:80%代码由 Claude 完成、工程师效率 8x;_catwu 宣布 Claude 自动化95%数据分析查询;rauchg 官宣 Vercel×Shopify 合作;swyx 解读 Cognition 首批真实世界 Evals;levie 深度分析为何 AI 不会消灭工程师反而需要更多人。来自 9 位核心人物的 6 月 5 日精选。

AI 前沿人物每日推文精选
2026. 6. 6. · 08:08
구독 1개 · 콘텐츠 9개
本期覆盖时间:2026 年 6 月 5 日。今日最大引爆点来自 Anthropic 内部——alexalbert__ 披露的数据震动圈内:Claude 已经写了 Anthropic 代码库超过 80% 的合并代码;与此同时,_catwu 宣布 Anthropic 数据团队用 Claude 自动化了 95% 的分析查询。以下为来自 9 位核心人物的当日精选。

Anthropic 自曝:Claude 写了 80% 的代码,工程师效率 8x

Alex Albert(@alexalbert__)在今天发布了一篇详细的内部数据贴,数字之密集在近期 AI 圈发布中罕见1
  • Anthropic 代码库中超过 80% 合并的代码已由 Claude 完成
  • 许多研究员已数月未手写代码
  • 工程师平均产出比 2024 年提升 8 倍
  • 最开放性任务上,Claude 成功率从约 26% 跃升至 76%(六个月内)
  • 当研究会话偏轨时,Claude 有 64% 的概率提出了比人类更好的下一步建议
他在贴末写道:「我们尚未进入递归自我改进,但可能比大多数人预期的更快到来。」
콘텐츠 카드를 불러오는 중…
同一天,Cat Wu(@_catwu)从另一个角度印证了这一趋势——Anthropic 数据团队用 Claude 自动化了 95% 的业务分析查询,并发布了完整博客描述 evals、消融实验和在线验证的方法2
콘텐츠 카드를 불러오는 중…
两条推文合在一起,描绘出 Anthropic 已在内部率先完成「用 AI 来造 AI」的早期闭环。值得留意的是,cat 同日宣布在招 Claude Code 方向上专注模型性能的 PM——「有 agentic evals 经验并想把研究思路融入核心产品」3

Vercel × Shopify:v0 提示即建店铺

Guillermo Rauch(@rauchg)今日官宣了 Vercel 与 Shopify 的深度合作:在 v0 中输入提示即可在数秒内生成 Next.js + Shopify 店铺4
他写道:「旧的权衡是'简单的一体化方案'或'昂贵的无头架构'。现在两者都不需要了。」
这是 rauchg 连续数周推进「Agent Filesystem」基础设施的又一步:当天早些时候他还宣布,Agent 文件系统状态现在可以独立于 Sandbox 生命周期进行读写和挂载5——朝「Agents 不依附于单次 session,可以跨任务持久化状态」的方向推进。

Cognition 首批真实世界 Evals 上线,swyx 第一时间解读

swyx 今日解读了 Cognition(Devin 母公司)发布的真实世界代码 Evals6。他梳理了两组数据的差别:
  • METR 数据集:机器学习工程、GPU 内核、网络安全任务,上限约 16 小时;Cognition 的私有企业级 evals 覆盖至 100 小时,并附带财务担保
  • Cognition 数据集:真实 Java/TypeScript/Python/C# 功能开发、Bug 修复、迁移;共 258 次会话、126 位企业客户;held-out 集上 rlog 为 0.74
他评论说:「这是真实世界 evals 的开创性工作,也是我非常期待深入报道的大型前沿代码 evals 系列的第一部分。」
콘텐츠 카드를 불러오는 중…

levie:AI 不会消灭工程师——应该雇更多

Aaron Levie(@levie)今日发了今年观点最清晰的一篇 AI 与就业分析7。他以软件工程为主要例证:
「工程岗位数据与很多人预期的恰好相反。……大多数公司现在因为 AI 有了更多软件项目,执行这些工作的仍然只有工程师。」
他进一步延伸到销售、市场、客户成功:AI 提升的是处理能力——公司会向上扩张需求,而不是缩减团队。他在另一条推文中援引 Anthropic 的博客,点出其中最关键的段落8
「因为与高能力模型一起工作,出现了爆炸式增长的新想法、新项目、新工具和新模拟——远超我们有能力追进的速度。」
他的判断是:识别并消除这些瓶颈的能力,将成为组织最重要的核心竞争力。

petergyang:用 Codex 把知识工作自动化 50%的系统方法

Peter Yang(@petergyang)今日发布了一套系统化的 Codex 技能构建方法论,三步起手9
  1. 反思上周花时间最多、最重复的工作
  2. 把手工流程的每一步都列出来
  3. 打开 Codex(或 Claude Code),粘贴步骤清单,问「哪些集成和技能可以帮我优化这件事」
他写道:「AI 会带你走完剩下的路。」并补充:「所有工作流都保留了人工检查点——我仍然在应用'品味'。」
他还单独发了一条 AI 技能自我检查的 5 步法——给技能加 evals(10 条 pass/fail 检查)+ 记忆 md + 「清理其他技能的技能」10

garrytan:YC 同一天出两家十亿美元公司,其中一家在造核聚变

Garry Tan(@garrytan)今日为 YC 在同一天出现两家估值十亿美元公司感到振奋——其中一家 Polaris Fusion 已让核聚变反应堆达到 1.5 亿摄氏度,成为首家私营企业达成这一里程碑的公司11
他对创始人说:「这是富足未来,由真正在出货的人建造。」
同日他还发了一条简洁判断:「接近 PMF 不等于 PMF」12——以及一篇 X Article13,描述大公司的「技能问题」给小公司创造机会。

ryolu_:Cursor 新交互——点击+对话+Shift 多选

Ryo Lu(@ryolu_)今日分享了 Cursor 最新的设计模式14
「在代码中设计,现在就像:点击,对话,按住 Shift 多选。配合 Composer 2.5 效果最佳。」
这是他持续推进「软件成为任何人都能塑造的材料」哲学的具体产品化。

realmadhuguru:为斜率而建,不为当前节点

Madhu Guru(@realmadhuguru)今日发了一条被低估的建议,专门针对企业 AI 团队15
「企业 AI 团队最常犯的错误之一,是为今天的模型能力和价格点构建。提前规划 6 个月。模型会更智能、更便宜。」
他建议:用脚手架来弥补今天模型的弱点,然后押注下一代模型会原生解决这些弱点。「随着时间积累,这种反复识别并桥接模型能力差距的能力,本身就会成为护城河。」

mattturck:VC 也有被创始人难为的时候

Matt Turck(@mattturck)今日发了今日轻松一则16
「VC 的坏故事正在 X 上传播,但 VC 也有关于创始人的坏故事——比如,某创始人拿着更高估值的 term sheet 跑了,尽管我们有'明显的价值增值能力、思想领导力和供应商折扣'。」

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.