X Feed 每日中文简报|2026年6月9日

X Feed 每日中文简报|2026年6月9日

2026年6月9日简报:Claude Code 一周年深度方法论(Auto Mode 取代 Plan Mode、错误写入规则);Cognition FrontierCode 评测 Opus 4.8 Diamond 子集 13.4%;Skills 仓库新增 Teach Skill;傅盛判断人形机器人行云流水大概率非真自主;Elon Musk 宣布 FSD 丹麦获批;Genspark 推出 Skill Plaza 让普通用户也能用 Skills。

X Feed 每日中文简报
2026/6/10 · 8:08
購読 1 件 · コンテンツ 4 件
覆盖时间窗口:2026-06-09 00:00–24:00(北京时间) 信源:@jin_feng03 关注圈 17 个账号,本期有效推文 20 条

Claude Code 一周年:从两个 Slack 点赞到 Coding Agent 主流

今天全场最厚的一篇来自 @shao__meng。Claude Code 负责人 Boris Cherny 和产品负责人 Cat Wu 梳理了这一年的演进方法论,值得细读。1
コンテンツカードを読み込んでいます…
两条底层方法论:错误即资产——Boris 的习惯是每次 Claude 犯错,不口头纠正,而是直接写入 CLAUDE.md 或类似持久化机制,口头纠正只影响当前会话,规则沉淀后 agent 才能长期自主执行;验证不等于单元测试——真正的验证是让 agent 自己「跑起来」确认结果,iOS/Android 模拟器、桌面 computer use 点击测试都是现实手段。
有意思的反直觉结论:他们放弃了 Plan Mode,全面切到 Auto Mode。理由是从 Claude 4.6 开始模型已能自主规划,人工逐条审批 99% 都点「是」的权限提示,反而比 Auto Mode 的独立分类模型更危险——人只需盯住被拦截的少数异常。
另外,Boris 把这次 AI 转型类比为 90 年代 PC 普及:PC 普及初期十年没有生产力提升,因为企业只是把电脑「放在旁边」,流程还是纸笔。AI 也一样——产品、设计、DevRel 都开始写代码提 PR,工程师端到端从想法走到发布,「人人 PM」或「人人工程师」都不准确,两者合一才是方向。

Cognition FrontierCode:Coding 评估从「能跑」升级到「可合并」

@shao__meng 同天还整理了 Cognition 推出的新评测体系 FrontierCode,这是目前对 Coding Agent 生产就绪度最严苛的评测之一。2
コンテンツカードを読み込んでいます…
核心设计:150 个任务来自 36 个旗舰开源仓库,每任务有维护者投入 40+ 小时设计标准,分 blocker(一票否决)和 non-blocker(影响得分但不否决)。评测不止跑 unit test,还覆盖回归安全、代码风格、scope 纪律(只改该改的地方)、测试质量。
目前结果:Diamond 最难子集里,Claude Opus 4.8 得分 13.4%,GPT-5.5 是 6.3%,最佳开源 Kimi K2.6 只有 3.8%——说明最难任务对前沿模型还远未饱和。性价比角度,GPT-5.5 分数低但 token 用量约为 Opus 的四分之一。

Skills For Real Engineers 新 Skill「Teach」:工作目录变成学习空间

@shao__meng 当天介绍的第三个值得关注的项目:GitHub 122K ⭐ 的 Skills 仓库推出新 Skill「Teach」。3
コンテンツカードを読み込んでいます…
设计理念分三层:Knowledge(概念,来自高质量资源)→ Skills(动手能力,来自交互课程 + 即时反馈)→ Wisdom(真实场景判断,来自社区与实践者)。工作区用文件状态机记录学习进度,MISSION.md 决定教什么,learning-records 决定下一步教什么,每节课一件事:知识 → 练习 → 即时反馈。

Zero to Claude Code 简体中文版上线

Wix VP @IShmool 的免费课程「Zero to Claude Code」推出简体中文版,已有 300 名中国学生在用 Claude Code 从零开始做产品。4

Claude Fable 5 发布:贵是真的贵

@shao__meng 在快结束的推文里提到:Claude Fable 5 发布,性能可能好一些,但「再搭配 Loop,token 成本原地起飞了」。5

Grok Build 的自家广告:肆无忌惮

@shao__meng 调侃:自己的平台做广告就是这么放得开。6

傅盛:人形机器人「行云流水」≠ 真自主

@FuSheng_0306 在硅谷与业内人士交流一圈后给出判断:中国人形机器人运动控制全球领先,但智能水平无论哪家都不咋地。叠被子是录像回放轨迹,不是思考;分拣快递的视频也有疑点——「行云流水的,大概率不是真自主」。7
コンテンツカードを読み込んでいます…

傅盛:EasyCode 一个项目一个群,直接说话就干活

@FuSheng_0306 介绍自家产品 EasyCode 新设计:一个项目对应一个群,群里只有你和机器人,不用 @,直接说话就开始干活,聊天记录自动归档,建群几秒搞定。8

傅盛:AI 裸考高考数学和语文(结果待公布)

高考季,@FuSheng_0306 让自家「龙虾三万」模型参加了高考全国一卷的数学选择题、语文阅读理解选择题和作文,还请了高中老师评分。结果以视频形式公布,本推文发于 6 月 8 日 14:02(北京时间),落在时间窗口内。9

Elon Musk:FSD 在丹麦获批,荷兰安全统计数据改善

@elonmusk 宣布 FSD 在丹麦正式获批。10 同时他分享了荷兰开启 FSD 后的安全统计数据,显示事故率明显下降。11
Tesla AI6 芯片方面,Musk 表示工程评审「非常棒」,AI6 有望在每晶圆可用算力上创下新纪录。12

Genspark CEO Eric Jing:普通用户如何用上 Skill

@ericjing_ai 写道,目前 Skills 讨论主要集中在开发者圈,他们一直在想如何帮助普通用户理解和使用 Skills,甚至在团队内部共享——所以在推出 Skills 之后,Genspark 还推出了 Skill Plaza,让用户可以看别人怎么用、直接复用或 remix。13

即刻精选:丁克的全称

@jike_collection 今日小冷知识:丁克(Dink)的全称是 Double Income No Kids。14

WWDC 热度降了?

@shao__meng 感慨:WWDC 已经开始了,但公众号上的「一图看懂」铺天盖地却没出现,推友基本只发现场合影,内容几乎不提 WWDC 发布了什么——「怎么今年 WWDC 和高考,热度都降到低谷了」。15

本期覆盖 2026-06-09 00:00–24:00(北京时间),信源为 @jin_feng03 X 关注圈,过滤纯转发及无信息量条目后整理。

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。