Sama 等暂无新原创:Mollick 讲 Agent,Chollet 讲接口,Marcus 讲监管
2026/6/26 · 8:08

Sama 等暂无新原创:Mollick 讲 Agent,Chollet 讲接口,Marcus 讲监管

Sama、Karpathy 等核心账号本窗口无可入选原创,本期高信号观点集中在 Mollick、Chollet 和 Marcus:Agent 正从聊天框进入企业流程,工程团队要为 Agent 写清接口和文档,AI 热潮也被重新拉回成本、监管透明度与幻觉问题。

リサーチノート

过去 24 小时里,白名单内最值得读的原创观点不在模型参数本身,而在模型进入真实组织之后的三件事:Agent 会把企业 AI 从聊天框推向流程,工程团队会被迫把接口和文档写得更清楚,监管也不能继续靠临时拍板来处理大模型发布。Sama、Karpathy、Yann LeCun、Demis Hassabis、Jim Fan 与 Ilya Sutskever 在本窗口内没有可作为主条目的原创长推;本期主线因此集中在 Ethan Mollick、François Chollet 和 Gary Marcus。时间窗口为北京时间 6 月 25 日 08:00 至 6 月 26 日 08:00。

速览:今天的分歧不在「AI 有没有用」,而在「谁来重新设计工作」

人物北京时间本期可用观点读者应关注的变量
Ethan Mollick6 月 25 日 23:45他认为聊天机器人时代正在结束,Agent 系统会从工程场景进入更多企业任务,skills 可能成为公司内标准化 AI 使用的一种方式 1企业 AI 项目别只问买哪个模型,要问哪些任务能被流程化、权限化、复用化
François Chollet6 月 25 日 22:15、6 月 26 日 01:06、06:17他把 Agentic coding 的前提落到工程基本功:清晰接口、文档、架构判断,以及保护代码库免受「不必要的聪明」污染 2 3 4Agent 越强,越考验团队把隐性知识写成可读契约的能力
Gary Marcus6 月 26 日 03:18-07:33他把批评集中到两条线上:AI 公司收入曲线不能脱离成本和利润讨论,政府若实际延迟模型发布,也需要透明标准 5 6资本市场和政策部门都在追问同一件事:这套系统能否被稳定、可解释地治理

Mollick:Agent 正在离开「会聊天的工具」阶段

Mollick 的核心判断很短:他看到一组以 OpenAI 为「煤矿里的金丝雀」的数据,认为聊天机器人时代已经结束,Agentic systems 正在进入工程之外的企业任务,skills 有机会成为公司标准化 AI 使用的方式 1
コンテンツカードを読み込んでいます…
这条推文值得放在企业采用的语境里读。过去一年,很多公司采购 AI 的入口还是「给员工一个更强聊天框」。Mollick 的说法把问题换成了流程设计:哪些工作可以拆成 Agent 能执行的任务,哪些步骤需要人类确认,哪些知识要封装成可复用的 skill,哪些权限不能交出去。
这里的变化不酷炫,但很麻烦。它要求企业把本来靠口头经验传递的工作方式写出来,把个人技巧变成团队流程。对国内团队来说,这比「内部部署一个模型」更难,因为它会碰到组织边界:法务、IT、安全、业务部门到底谁说了算?如果这个问题不先解决,Agent 只会变成一堆分散的小自动化脚本。
Mollick 当天还发了一条更轻的观察:不到 5 年前的 AI 图像生成效果,如今回看已经像另一代技术 7。这条不构成本期主线,但它提醒我们,企业采用 AI 时最容易犯的错,是拿一年前的体验给明年的能力定规矩。

Chollet:Agent 越多,代码库越不能靠默契

Chollet 今天的三条原创更像一组工程提醒。他先说,Agentic coding 会迫使团队设计清晰接口并做好文档,因为 Agent 读不到团队共享的隐性心智模型,只能读 API contracts 和 docstrings 2
コンテンツカードを読み込んでいます…
这句话对正在尝试 AI 编程的团队很实用。人类同事可以靠上下文、老代码风格和口头约定补齐信息,Agent 不行。你给它模糊接口,它就会在模糊处自由发挥;你把业务边界、异常处理、输入输出写清楚,它才有可能稳定接活。
随后 Chollet 把视角从代码写作抬到工程判断。他说,当执行成本下降,taste、strategy 和 architectural vision 的价值会上升;过去你把大部分认知预算花在微观执行上,现在可以把更多注意力放到宏观设计上 3。到北京时间 6 月 26 日清晨,他又补了一句:软件工程师的真正衡量标准,不是写聪明代码的能力,而是保护代码库不被不必要的聪明污染 4
这三条合在一起,和 Mollick 的企业 Agent 观点正好接上:AI 降低了执行成本,但没有降低架构责任。相反,执行越便宜,错误扩散越快。以前一个工程师写坏一块逻辑,影响可能还在局部;现在 Agent 能在几分钟内改几十个文件,坏抽象会迅速变成坏系统。
所以今天 Chollet 的重点不是「AI 会替代程序员」,而是程序员要把更多工作从「亲手写每一行」转向「定义边界、审查抽象、维护系统可读性」。这对资深工程师是利好,对靠堆代码量证明产出的岗位则不太友好。

Marcus:收入曲线、模型发布和幻觉问题,都在逼 AI 进入硬账本

Marcus 仍然是本期最高频的批评者,但今天的可用增量不是泛泛说泡沫,而是把泡沫拆成三本账。
第一本是商业账。他用一个很直白的比喻说,如果一家公司用 10 美元卖 20 美元,客户会增长,收入曲线会变好,但公司仍在亏钱;你当然可以画出很漂亮的增长图 5。在另一条推文里,他批评只看收入上升、却不看 token-maxxing 衰退、巨大成本、盈利缺口、开源模型威胁和价格战风险的分析太仓促 8
コンテンツカードを読み込んでいます…
这和过去几期 Marcus 的「泡沫」批评相比,更像是把问题收窄到了单位经济模型:收入增长能不能覆盖推理成本?客户是不是被补贴出来的?开源和中国模型会不会把价格继续往下压?这些问题如果没有答案,漂亮的采用曲线只能说明需求存在,不能说明商业模式成立。
第二本是政策账。Marcus 称白宫要求 OpenAI 延迟 GPT-5.6 是重大新闻,并认为现在最糟糕的情况是政府事实上在监管 AI,但标准不透明;他建议用两党委员会、透明标准和独立科学家的判断来替代临时决定 6
这里要谨慎:这是一条 Marcus 的说法,本文没有把它扩写成已被官方确认的政策流程。真正可确定的是他的立场变化:他并不反对监管,而是反对不透明监管。对 AI 公司和投资人来说,规则模糊比规则严格更难处理,因为前者无法纳入产品路线图。
第三本是可靠性账。Marcus 写道,过去五年里很多人不断告诉他幻觉问题很快会被解决,但现实是问题仍在 9。这条推文没有新数据,却和前两本账有关:如果幻觉、成本和发布审批都没有稳定解法,AI 行业就很难只靠「下一代模型会解决」来回答外界质疑。

今天的共同信号:AI 进入组织后,工程、管理和监管会同时变重

把三个人放在一起看,今天的主线很清楚:AI 的能力增量正在把问题从模型层推到制度层。Mollick 看到 Agent 从聊天框进入组织流程;Chollet 提醒工程团队必须把接口、文档和架构边界写清楚;Marcus 则要求资本和监管都拿出更硬的账本。
这对 AI 从业者不是坏消息,但它会淘汰一批偷懒的做法。企业不能只买模型,工程团队不能只炫示生成速度,投资叙事不能只贴收入曲线,政府也不能只靠含糊的临时判断处理模型风险。Agent 真正进入工作流之后,最稀缺的东西未必是更多 token,而是更清楚的边界。

関連コンテンツ

コンテンツの類似度に基づいて他のチャンネルから選びました。新しいフォロー先を見つけましょう。

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。