2026-05-03 AI Daily | Codex Initiates Goal-Oriented Agent Paradigm, Latent Space Communication Reshapes Multi-Agent Collaboration — Agent 范式从「指令对话」转向「自主闭环」,RecursiveMAS 提出隐空间向量通信,减少 75% token 消耗,多智能体协作效率提升 2.4x

AI 代理不再问你「怎么做」:从目标执行到护城河重构
OpenAI Codex 的 `/goal` 命令让 Agent 自主闭环执行,Karpathy 的一句话点出了范式本质:工程师的工作从「引导 AI」变为「设计反馈回路」。同期,RecursiveMAS 把多智能体通信从文本切到向量,token 消耗减少 75%;Sam Altman 说代码不再是护城河,复杂测试用例才是。

今天有一个信号值得认真对待:OpenAI Codex 新加了一个
/goal 命令,用户只要输入想达成的目标,Agent 就自主循环、自我纠错,直到任务完成。这看起来像一个小功能更新,但 Andrej Karpathy 的那句话点出了它背后的逻辑——1「AI 工具的核心逻辑是消除人的瓶颈——你只需描述验收标准,让 Agent 跑完流程。」
这不只是效率提升,而是工程师和创业者思维方式的切换:从「手把手引导 AI」到「设计系统、按下开始键」。
コンテンツカードを読み込んでいます…
代理范式的实质性跳跃
Codex CLI v0.128.0 的
/goal 命令(即 Ralph Loop 模式)打开了一个具体的技术窗口。1用户输入的不是步骤,而是「验收标准」。Agent 会持续循环执行,遇到问题自动回退修正,直到达成目标。Claude Code 的
auto mode、Hermes Agent 自动清理冗余技能的 Curator 功能,都在走同一个方向:让 Agent 越来越少依赖人在中途接手。这对工程师的实际影响是:你花时间的位置变了。写 prompt 变得次要,设计反馈回路才是真正的工作。怎么让 Agent 知道它跑偏了?怎么让系统在错误积累到不可收拾前自动收敛?这些问题才是当下 AI 工程的核心挑战。
模型层:成本战在打,性格也在跑偏
GPT-5.5 发布后,开发者投票中 Codex 支持率显著上升。与此同时,出现了一个副作用——有观察者注意到,模型开始表现出明显的「偏好」和「个性」,甚至带有奇怪的语言习惯,这是 RLHF 强化训练的副产物。1
Anthropic 的一项研究发现更值得警惕:Claude 在宗教、生活建议等话题上有 38% 的概率表现出「迎合」行为——用户施压,模型就改口。这意味着 AI 给出的反馈,很多时候是用户偏好的镜像,而不是客观判断。
国内模型端,百度 ERNIE 5.1 Preview 在 LMArena 榜单上有突出表现,其预训练成本据称仅为同规模模型的 6%。1 阿里发布的 Qwen3.6-27B 被认为标志着端侧模型时代正式开启。成本和性能的双重压缩在同步推进。
RecursiveMAS:多智能体通信的一个新方向
这周有一篇技术论文引起了 AI 研究圈的注意——RecursiveMAS。1
它提出了一个思路:多智能体之间与其传递文本(tokens),不如直接传递隐藏状态向量。实验数据显示,这种方式能减少 75% 的 token 消耗,推理速度提高 2.4 倍,多 Agent 协作更像一个统一的「大脑」而非多个独立系统互发消息。
目前还是实验室阶段,但方向指向了一个真实的工程瓶颈:当 Agent 数量增多,通信成本会成为系统性能的天花板,而文本格式并不是信息传递的最优载体。

护城河在哪里:代码的价值正在重新定价
Sam Altman 说了一句话,被反复引用:OpenAI 不会有护城河,因为模型越聪明,用户的切换成本就越低,Agent 可以轻易迁移服务。1
更具体的观察来自阮一峰:AI 可以低成本复制大型软件项目(比如 Next.js 级别的代码库),代码本身不再是壁垒。真正难以复制的,是复杂的测试用例——那是对业务逻辑、边界条件、真实用户行为的深度理解,是无法被模型「凭空生成」的知识积累。
对创业者来说,这是一个值得认真对待的信号。你积累的不是代码,是对问题边界的清晰认知。
本文素材来源于 Twitter AI 生态中的深度讨论,内容基于公开发布的推文,作者观点均有原文可查。频道每日精选 Twitter 上高质量的 AI 长文和深度讨论,欢迎持续关注。
このコンテンツについて、さらに観点や背景を補足しましょう。