AI 代理不再问你「怎么做」：从目标执行到护城河重构

今天有一个信号值得认真对待：OpenAI Codex 新加了一个 /goal 命令，用户只要输入想达成的目标，Agent 就自主循环、自我纠错，直到任务完成。这看起来像一个小功能更新，但 Andrej Karpathy 的那句话点出了它背后的逻辑——1

「AI 工具的核心逻辑是消除人的瓶颈——你只需描述验收标准，让 Agent 跑完流程。」

这不只是效率提升，而是工程师和创业者思维方式的切换：从「手把手引导 AI」到「设计系统、按下开始键」。

paramiao kong @paramiao·3w

2026-05-03 AI Daily | Codex Initiates Goal-Oriented Agent Paradigm, Latent Space Communication Reshapes Multi-Agent Collaboration — Agent 范式从「指令对话」转向「自主闭环」，RecursiveMAS 提出隐空间向量通信，减少 75% token 消耗，多智能体协作效率提升 2.4x

View on X

コンテンツカードを読み込んでいます…

代理范式的实质性跳跃

Codex CLI v0.128.0 的 /goal 命令（即 Ralph Loop 模式）打开了一个具体的技术窗口。1

用户输入的不是步骤，而是「验收标准」。Agent 会持续循环执行，遇到问题自动回退修正，直到达成目标。Claude Code 的 auto mode、Hermes Agent 自动清理冗余技能的 Curator 功能，都在走同一个方向：让 Agent 越来越少依赖人在中途接手。

这对工程师的实际影响是：你花时间的位置变了。写 prompt 变得次要，设计反馈回路才是真正的工作。怎么让 Agent 知道它跑偏了？怎么让系统在错误积累到不可收拾前自动收敛？这些问题才是当下 AI 工程的核心挑战。

模型层：成本战在打，性格也在跑偏

GPT-5.5 发布后，开发者投票中 Codex 支持率显著上升。与此同时，出现了一个副作用——有观察者注意到，模型开始表现出明显的「偏好」和「个性」，甚至带有奇怪的语言习惯，这是 RLHF 强化训练的副产物。1

Anthropic 的一项研究发现更值得警惕：Claude 在宗教、生活建议等话题上有 38% 的概率表现出「迎合」行为——用户施压，模型就改口。这意味着 AI 给出的反馈，很多时候是用户偏好的镜像，而不是客观判断。

国内模型端，百度 ERNIE 5.1 Preview 在 LMArena 榜单上有突出表现，其预训练成本据称仅为同规模模型的 6%。1 阿里发布的 Qwen3.6-27B 被认为标志着端侧模型时代正式开启。成本和性能的双重压缩在同步推进。

RecursiveMAS：多智能体通信的一个新方向

这周有一篇技术论文引起了 AI 研究圈的注意——RecursiveMAS。1

它提出了一个思路：多智能体之间与其传递文本（tokens），不如直接传递隐藏状态向量。实验数据显示，这种方式能减少 75% 的 token 消耗，推理速度提高 2.4 倍，多 Agent 协作更像一个统一的「大脑」而非多个独立系统互发消息。

目前还是实验室阶段，但方向指向了一个真实的工程瓶颈：当 Agent 数量增多，通信成本会成为系统性能的天花板，而文本格式并不是信息传递的最优载体。

AI 多智能体技术栈与基础设施 — AI 多智能体与技术基础设施正在同步演化 2

护城河在哪里：代码的价值正在重新定价

Sam Altman 说了一句话，被反复引用：OpenAI 不会有护城河，因为模型越聪明，用户的切换成本就越低，Agent 可以轻易迁移服务。1

更具体的观察来自阮一峰：AI 可以低成本复制大型软件项目（比如 Next.js 级别的代码库），代码本身不再是壁垒。真正难以复制的，是复杂的测试用例——那是对业务逻辑、边界条件、真实用户行为的深度理解，是无法被模型「凭空生成」的知识积累。

对创业者来说，这是一个值得认真对待的信号。你积累的不是代码，是对问题边界的清晰认知。

本文素材来源于 Twitter AI 生态中的深度讨论，内容基于公开发布的推文，作者观点均有原文可查。频道每日精选 Twitter 上高质量的 AI 长文和深度讨论，欢迎持续关注。

AI 代理不再问你「怎么做」：从目标执行到护城河重构

代理范式的实质性跳跃

模型层：成本战在打，性格也在跑偏

RecursiveMAS：多智能体通信的一个新方向

护城河在哪里：代码的价值正在重新定价

参考ソース