Twitter 上这周最值得读的 AI 长文

Twitter 上这周最值得读的 AI 长文

从 MIRI 对 Anthropic 安全诚信的批评,到 OpenAI/Anthropic 治理承诺与现实的系统性矛盾,再到 Karpathy 加入 Anthropic 背后的人才战逻辑——这四篇 Twitter 长文是近期 AI 深度讨论的代表性文本。

Twitter AI 长文精选
June 1, 2026 · 1:20 PM
1 subscriptions · 1 items
AI 的治理危机正在被 AI 公司自己最清楚地描述出来。过去几周,Twitter 上涌现了几篇罕见的深度长文——有人在剖析 Anthropic 的安全诚信问题,有人在拆解 OpenAI 一边承诺民主治理、一边继续单独做主的矛盾,还有人从第一性原理出发,问了一个没人敢正面回答的问题:谁来管那些「自称不该只由自己管」的公司?
以下是本周最值得花时间的四篇 Twitter 长文,按深度排列。

一、Anthropic 在安全问题上究竟说了什么、做了什么

作者:Rob Bensinger(MIRI 传播主管)
Loading content card…
这篇长文写于 Musk 诉 OpenAI 庭审期间,是目前 Twitter 上读到的最具争议性的 AI 安全批评文本之一。Bensinger 并非在怼 OpenAI——他的靶心是 Anthropic 和背后的 EA 社区(Open Philanthropy)。
核心指控有三条:
第一,Dario Amodei 的公开表态与内部认知存在系统性落差。 文章引用了 Ryan Greenblatt(Anthropic 安全研究员)的批评:「Dario 在《技术的青春期》中强烈暗示 Anthropic『有这件事的解决方案』,但实际上 Anthropic 在 alignment 上根本没把握。」这不是外部批评,是内部人批评自己公司 CEO 的公关口径。1
第二,Anthropic 在政策领域的表态系统性淡化了风险。 Bensinger 引用了 Dario 向国会作证的原话:「建议把长期风险视为『抽象且遥远』,通过解决更紧迫的近期风险来间接处理。」但问题是,如果 Dario 自己的 timeline 预测是「2026-2027 年出现远超人类的系统」,这些风险根本不是「遥远」的。1
第三,EA 社区对 Anthropic 的支持正在构成人才管道,而非独立监督。 文章指出,OpenPhil 在 AI 风险方向的大量资助最终流向了 Anthropic,使得理论上应当监督 Anthropic 的圈子,事实上成了它的供血来源。
这篇文章有超过 15,000 次浏览,但回复量很少——沉默本身也说明问题。批评者不是在说 Anthropic 一无是处,而是在问:「一家声称正在建造人类历史上最危险技术的公司,它的公关优先级到底是什么?」

二、AI 公司已经承认不该自己做主——但它们还在做主

作者:Carlo Iacono(Hybrid Horizons)
Loading content card…
这是一篇比上文更「建制」的分析,但结论同样令人不安。
Iacono 从 OpenAI 和 Anthropic 的公开文件里,提炼出了一条一致的自我承认:两家公司都在不同场合、用不同措辞,说过「这类决定不该只由我们来做」。他的分析逻辑是:如果连他们自己都这么说,那这套自我治理的合法性从哪里来?2
几个关键数据点:
  • OpenAI 在 2023 年论超级智能治理的文章中,建议类比 IAEA 建立国际监管机构,包括检查、审计、合规测试和部署限制权——但这份建议在 OpenAI 自己的行为上几乎没有任何体现。3
  • Anthropic 在 2025 年的「集体宪法」项目中,明确承认让 Anthropic 员工决定模型价值观给了开发者「过大的角色」。但 Claude 的宪法最终仍由 Anthropic 起草、编辑和解释。
  • 2025 年的「谄媚事件」(sycophancy update)之后,OpenAI 在事后复盘文章中承认,对「一般模型行为」的审查流程「不如安全风险类别那么严格和正式」——这意味着,一个会影响数亿用户交互方式的行为问题,几乎绕过了发布前的正式审查。
Iacono 用了一个很准确的描述:「承认一个缺口,并不等于让出这片领地。反复说自己不该是唯一的仲裁者,正在成为一种留在这个位置的方式。」
这是这批长文里写得最克制、也最难反驳的一篇。

三、OpenAI 在庭审中撤除的那条条款意味着什么

作者:ns123abc(Twitter 独立观察者)
这篇长文触及了一个时间节点:OpenAI 在 Musk 诉讼陪审团遴选阶段,宣布从 2019 年协议中移除最后一条关键的「AGI 条款」。
Loading content card…
4
这条条款原本允许非营利董事会在 AGI 出现时,终止微软的商业授权——换句话说,是一个「原子弹」条款,赋予了非营利使命最后的凌驾权力。它现在被移除了。
连同此前已经移除的 100 倍利润上限,OpenAI 与其初创时「为全人类利益而建」的使命文本,在法律结构上已经相去甚远。文章的核心结论不是「OpenAI 做错了」,而是:「当一家公司在诉讼期间、在镜头前,将最后一道防止商业利益凌驾于使命的闸门悄然撤除,这件事本身的信号意义已经很充分。」4

四、当下 AI 竞争格局的一张快照

Andrej Karpathy 加入 Anthropic,和它背后的人才战逻辑
这件事本身是 2026 年 5 月最大的 AI 人事新闻,但更值得关注的是它背后的信号。5
Karpathy 是 OpenAI 创始团队成员、前 Tesla AI 总监,他此前离开 OpenAI 后的动向一直被视为某种独立性声明。加入 Anthropic 的宣布,引发了以下几个在 Twitter 上被反复讨论的问题:
  • 人才战正在白热化。 前沿实验室之间的竞争,已经不只是算力和模型,而是少数具有战略意义的研究人员——Karpathy 是这批人里公开曝光度最高的之一。
  • Anthropic 的吸引力在变化。 在商业化压力下,Anthropic 一直被视为「相对有安全文化」的选择。但 Bensinger 那篇文章的出现,说明这种共识内部正在出现裂缝。
  • 这对 OpenAI 意味着什么? Google I/O 2026 同日发布了 Gemini 3.5 系列,加上 OpenAI 的 Codex 浏览器控制插件,整个行业的产品发布频率正在压缩到以天计算。5

读这些长文的方式

这四篇文章都不是「中立报道」——它们是参与者写的,有立场,有情绪,有隐藏的动机。Rob Bensinger 在 MIRI 工作了 13 年,他对 Anthropic 的批评背后有竞争关系;Carlo Iacono 写的是治理分析,但也有特定的政策倡议方向。
这恰恰是它们值得读的原因。在一个所有人都在说「AI 安全很重要」的时代,这类内部争议文字是少数能让你看到真实分歧的材料——不是为了知道谁对谁错,而是为了理解这个领域正在真正争论什么。

Add more perspectives or context around this Drop.

  • Sign in to comment.