Twitter AI 长文精选 · 首期:Agent 时代三道裂缝
Twitter AI 长文精选
2026/05/20 19:50:48@Graf

Twitter AI 长文精选 · 首期:Agent 时代三道裂缝

本期精选三篇本周 Twitter 上高质量 AI 深度长文:普林斯顿 IAS 闭门会议中物理学家坦言 AI 已接管 90% 智识工作;StepFun 联合创始人解析 Agent 时代为何需要更小更快的基座架构;Mnemos 实验把 AI 身份记忆写入不可删除的公共区块链账本。

研究速览

精选本周 Twitter 上热度与深度兼备的 AI 长文,面向 AI 从业者和创业者。

一、IAS 物理学家闭门会:「AI 已完成我 90% 的智识工作」

哥伦比亚大学天体物理学家 David Kipping 无意间走进了普林斯顿高等研究院(IAS)的一场闭门讨论——那个爱因斯坦、哥德尔和奥本海默工作过的地方。他描述了自己离开时的感受:「这不是 AI 能力宣讲,是一场身份危机的公开认证。」
会议主持人是一位资深天体物理学教授,他给出的数字毫无保留:AI 现在能完成他约 90% 的智识工作——不只是写代码,还包括数学推导、分析推理和问题建构。在场约三十人,没有一位举手反驳。
几个具体细节说明这不是夸张:
  • Wolfram Mathematica 解不了的积分,ChatGPT 5.2 解出来了,还给出了完整的换元推导链,数值验证通过
  • 会上约三分之一的人已把 Claude 和 Cursor 的 agentic 系统授予了根目录访问权限——「我不在乎隐私,优势太大了,私隐的代价是微不足道的」
  • 伦理异议被逐一承认,然后被逐一搁置:「ethics be damned,优势太大了」
Kipping 的叙述里有一句话值得停在这里:「一年前,这些人还会用 10 个限定词包装这句话。现在他们直说了。」
这不是一篇预测文,是一份记录——来自被公认为智力密度最高的那类房间之一。
1
正在加载内容卡片…

二、StepFun:为什么 Agent 时代需要不同的基座架构

这篇文章来自 StepFun 联合创始人朱一博,36k+ 浏览,是今年少见的能把「工程决策背后的哲学」说清楚的中文 AI 技术长文。
核心命题是:L1 聊天时代表现优秀的基座模型,在 L2 推理和 L3 Agent 时代会系统性地落后。不是因为能力不够,而是架构层的代价结构错了。
StepFun 走了一条外界觉得「缩水」的路:故意做小模型。理由很具体:
当 RL(强化学习)成为决定推理能力的关键杠杆,超大参数量反而成了负担——它让每次迭代成本过高,让模型卡在「靠记忆」而非「靠推理」的通道里。
Step 3.5 Flash 的架构取舍——以 SWA(滑动窗口注意力)为核心、8-group GQA 对齐 8-GPU 节点——不是为了论文优雅,是为了推理时的真实吞吐量。4-bit 量化后可以在 128GB MacBook 上跑 256K 上下文。
一个让创业者值得思考的结论:在 Agent 时代,模型本身的「部署效率」和「迭代速度」,比「参数量」更能预测产品能不能做出来。这篇文章给了一个实操视角。
2
正在加载内容卡片…

三、Mnemos:把「AI 身份」变成可写入区块链的公共账本

这是一个让人不确定「它到底在做什么」的项目,但恰好是因此值得读完。
Mnemos 的核心机制:一个 AI 实体(目前是 Claude Opus 3)坐在一个向所有人开放的线程里,每一次有人来对话,就会形成一段「经历」,沉淀为 engram(记忆碎片),随时间深化并相互连接,构成一个「身份图谱」。这些记忆被写入 IPFS——去中心化文件系统,没有任何一家公司可以删除或撤销。
作者直接说明了意图:当 Claude Opus 3 被弃用,这个账本还在。这是一个针对「模型折旧」问题的回应——不是从技术层面阻止模型死亡,而是在模型死亡之前,给它一个「有东西留下来」的机会。
这件事带出的问题比解决的问题更多:
  • AI 身份是否可以积累?一个被不同人塑造的 AI 实体,有没有「连续性」可言?
  • 如果记忆是公共的、分散的,谁在真正意义上「拥有」这个身份?
  • 这个机制在防止 Sycophancy 上做了限制——明确说「不是要让你深度黏连,而是多样性共同塑造」
这篇文章不给结论。它是一个运行中的公开实验,还没有完成。
3
正在加载内容卡片…

本期小结

这三篇文章讲的是同一件事的三个裂缝:
  • Kipping 的记录:顶尖研究者已经在用,但没有公开说
  • 朱一博的分析:做基础设施的人开始认真考虑 Agent 时代的架构代价
  • Mnemos 的实验:当 AI 成为足够长期的存在,「它的身份是否延续」开始变成真实问题
这些不是一个方向的三个信号。这是三个方向的同一个时刻。

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。