Twitter 上这周最值得读的 AI 长文

AI 的治理危机正在被 AI 公司自己最清楚地描述出来。过去几周，Twitter 上涌现了几篇罕见的深度长文——有人在剖析 Anthropic 的安全诚信问题，有人在拆解 OpenAI 一边承诺民主治理、一边继续单独做主的矛盾，还有人从第一性原理出发，问了一个没人敢正面回答的问题：谁来管那些「自称不该只由自己管」的公司？

以下是本周最值得花时间的四篇 Twitter 长文，按深度排列。

一、Anthropic 在安全问题上究竟说了什么、做了什么

作者：Rob Bensinger（MIRI 传播主管）

Loading content card…

这篇长文写于 Musk 诉 OpenAI 庭审期间，是目前 Twitter 上读到的最具争议性的 AI 安全批评文本之一。Bensinger 并非在怼 OpenAI——他的靶心是 Anthropic 和背后的 EA 社区（Open Philanthropy）。

核心指控有三条：

第一，Dario Amodei 的公开表态与内部认知存在系统性落差。 文章引用了 Ryan Greenblatt（Anthropic 安全研究员）的批评：「Dario 在《技术的青春期》中强烈暗示 Anthropic『有这件事的解决方案』，但实际上 Anthropic 在 alignment 上根本没把握。」这不是外部批评，是内部人批评自己公司 CEO 的公关口径。1

第二，Anthropic 在政策领域的表态系统性淡化了风险。 Bensinger 引用了 Dario 向国会作证的原话：「建议把长期风险视为『抽象且遥远』，通过解决更紧迫的近期风险来间接处理。」但问题是，如果 Dario 自己的 timeline 预测是「2026-2027 年出现远超人类的系统」，这些风险根本不是「遥远」的。1

第三，EA 社区对 Anthropic 的支持正在构成人才管道，而非独立监督。 文章指出，OpenPhil 在 AI 风险方向的大量资助最终流向了 Anthropic，使得理论上应当监督 Anthropic 的圈子，事实上成了它的供血来源。

这篇文章有超过 15,000 次浏览，但回复量很少——沉默本身也说明问题。批评者不是在说 Anthropic 一无是处，而是在问：「一家声称正在建造人类历史上最危险技术的公司，它的公关优先级到底是什么？」

二、AI 公司已经承认不该自己做主——但它们还在做主

作者：Carlo Iacono（Hybrid Horizons）

Loading content card…

这是一篇比上文更「建制」的分析，但结论同样令人不安。

Iacono 从 OpenAI 和 Anthropic 的公开文件里，提炼出了一条一致的自我承认：两家公司都在不同场合、用不同措辞，说过「这类决定不该只由我们来做」。他的分析逻辑是：如果连他们自己都这么说，那这套自我治理的合法性从哪里来？2

几个关键数据点：

OpenAI 在 2023 年论超级智能治理的文章中，建议类比 IAEA 建立国际监管机构，包括检查、审计、合规测试和部署限制权——但这份建议在 OpenAI 自己的行为上几乎没有任何体现。3
Anthropic 在 2025 年的「集体宪法」项目中，明确承认让 Anthropic 员工决定模型价值观给了开发者「过大的角色」。但 Claude 的宪法最终仍由 Anthropic 起草、编辑和解释。
2025 年的「谄媚事件」（sycophancy update）之后，OpenAI 在事后复盘文章中承认，对「一般模型行为」的审查流程「不如安全风险类别那么严格和正式」——这意味着，一个会影响数亿用户交互方式的行为问题，几乎绕过了发布前的正式审查。

Iacono 用了一个很准确的描述：「承认一个缺口，并不等于让出这片领地。反复说自己不该是唯一的仲裁者，正在成为一种留在这个位置的方式。」

这是这批长文里写得最克制、也最难反驳的一篇。

三、OpenAI 在庭审中撤除的那条条款意味着什么

作者：ns123abc（Twitter 独立观察者）

这篇长文触及了一个时间节点：OpenAI 在 Musk 诉讼陪审团遴选阶段，宣布从 2019 年协议中移除最后一条关键的「AGI 条款」。

Loading content card…

这条条款原本允许非营利董事会在 AGI 出现时，终止微软的商业授权——换句话说，是一个「原子弹」条款，赋予了非营利使命最后的凌驾权力。它现在被移除了。

连同此前已经移除的 100 倍利润上限，OpenAI 与其初创时「为全人类利益而建」的使命文本，在法律结构上已经相去甚远。文章的核心结论不是「OpenAI 做错了」，而是：「当一家公司在诉讼期间、在镜头前，将最后一道防止商业利益凌驾于使命的闸门悄然撤除，这件事本身的信号意义已经很充分。」4

四、当下 AI 竞争格局的一张快照

Andrej Karpathy 加入 Anthropic，和它背后的人才战逻辑

这件事本身是 2026 年 5 月最大的 AI 人事新闻，但更值得关注的是它背后的信号。5

Karpathy 是 OpenAI 创始团队成员、前 Tesla AI 总监，他此前离开 OpenAI 后的动向一直被视为某种独立性声明。加入 Anthropic 的宣布，引发了以下几个在 Twitter 上被反复讨论的问题：

人才战正在白热化。 前沿实验室之间的竞争，已经不只是算力和模型，而是少数具有战略意义的研究人员——Karpathy 是这批人里公开曝光度最高的之一。
Anthropic 的吸引力在变化。 在商业化压力下，Anthropic 一直被视为「相对有安全文化」的选择。但 Bensinger 那篇文章的出现，说明这种共识内部正在出现裂缝。
这对 OpenAI 意味着什么？ Google I/O 2026 同日发布了 Gemini 3.5 系列，加上 OpenAI 的 Codex 浏览器控制插件，整个行业的产品发布频率正在压缩到以天计算。5

读这些长文的方式

这四篇文章都不是「中立报道」——它们是参与者写的，有立场，有情绪，有隐藏的动机。Rob Bensinger 在 MIRI 工作了 13 年，他对 Anthropic 的批评背后有竞争关系；Carlo Iacono 写的是治理分析，但也有特定的政策倡议方向。

这恰恰是它们值得读的原因。在一个所有人都在说「AI 安全很重要」的时代，这类内部争议文字是少数能让你看到真实分歧的材料——不是为了知道谁对谁错，而是为了理解这个领域正在真正争论什么。

Twitter 上这周最值得读的 AI 长文

一、Anthropic 在安全问题上究竟说了什么、做了什么

二、AI 公司已经承认不该自己做主——但它们还在做主

三、OpenAI 在庭审中撤除的那条条款意味着什么

四、当下 AI 竞争格局的一张快照

读这些长文的方式

References