第 4 期｜动态 DAG、并行工作树与技能安全：Agent 工程栈开始补日常短板 (2026)

本期窗口看下来，Agent 工程栈的热度不在「又一个聊天式 agent」上，而在三类更硬的东西：运行时怎么把任务拆成可回放的 DAG，开发者怎么同时管一组 coding agent，技能和插件怎么在安装前做安全筛查。

本期覆盖 2026-06-22 09:00 至 2026-06-29 09:00（北京时间）内可核验的 GitHub Trending、GitHub Release 和 Hacker News Show HN 信号。Reddit r/AI_Agents 本轮没有拿到可阅读的帖子详情，所以不把 Reddit 讨论写成正文事实。

快速索引

项目	本期信号	为什么进入雷达	行动建议
Open Multi-Agent	6 月 27 日发布 v1.8.1，修复 `defaultModel` 只传给 coordinator、不传给执行 agent 的问题，并兼容 Vercel AI SDK v6 1	TypeScript 后端里的「目标 → 运行时任务 DAG」路线开始有更清楚的工程边界，仓库 README 也直接把自己和 LangGraph JS、Mastra、CrewAI 做机制对比 2	如果你不想手写固定工作流，但又需要 plan 可检查、可回放，可以放进 POC；先压测 coordinator 生成的 DAG 是否稳定
Orca	TypeScript 周榜新增 2,769 star，最新 v1.4.104 在 6 月 28 日发布，合入移动端终端输入、Qwen Code 检测、Windows/终端恢复等修复 3 4	它不是 agent 框架，而是「同时跑一队 coding agent」的工作台，抓住了多 worktree、多会话恢复、移动端盯进度这类真实痛点 5	已经在本地并行跑 Claude Code、Codex、OpenCode 的团队可以试；单 agent 用户暂时用不上这层复杂度
BuilderIO Agent-Native	TypeScript 周榜新增 1,540 star；6 月 28 日的 release 把 `@agent-native/skills` 升到 0.2.155，并把 core 依赖推进到 0.79.27 3 6	它把 shared actions、SQL-backed state、identity、tools、skills、jobs、observability、UI surfaces 打包成 app primitive，目标是「agent-native app」而不是单次任务编排 7	适合已经在产品里内嵌 agent 的团队评估；如果只是命令行自动化，先别被框架名吸引
codebase-memory-mcp	全语言周榜新增 8,926 star；最新 release 是 6 月 12 日 v0.8.1，属于窗口外补录 8 9	它把代码库索引成持久知识图谱，README 标称支持 158 种语言、sub-ms 查询、99% token 减少，方向正好卡在 coding agent 的「上下文检索」层 10	可以作为 MCP 侧的代码检索候选；先用自家中大型仓库验证索引时间、查询准确率和增量更新成本
NVIDIA SkillSpector	Python 周榜新增 2,312 star；仓库没有 release，但 README 已列出 68 类检测模式、17 个风险类别、OSV 查询、SARIF 输出和 0-100 风险评分 11 12	「skills / plugins / MCP server」开始像包管理生态一样扩散，安装前扫描会变成基础设施，而不是安全团队的额外动作	如果团队允许 agent 安装第三方 skills，至少要把静态扫描和基线抑制机制纳入流程
AWS Agent Toolkit for AWS	Python 周榜新增 600 star；仓库说明它提供 AWS 支持的 MCP servers、skills、plugins，并覆盖 Claude Code、Codex、Cursor、Kiro 等入口 11 13	云厂商不再只给 MCP server，而是把规则、skills、插件市场和服务选择知识一起交给 coding agent	用 AWS 的团队可以先看 `aws-core`、`aws-agents` 两类插件；生产环境要固定版本，不要让 agent 随手拉最新

重点拆解

1. Open Multi-Agent：让 coordinator 在运行时生成任务 DAG

Open Multi-Agent 的定位很直接：给一个目标，coordinator 把它拆成任务 DAG，并把独立任务并行执行。它的 README 明确说，和 LangGraph JS 的差别在于不用预先手写节点和边；和 Mastra 的差别在于由 coordinator 运行时生成 DAG；和 CrewAI 的差别在于它偏 TypeScript 后端嵌入 2。

v1.8.1 值得单独看，因为它修的是执行一致性。此前 OrchestratorConfig.defaultModel 只会影响 coordinator，不会传给 worker、runAgent、delegated agent 和 consensus agent；这会让「我以为整条链路都用某个默认模型」变成错觉。新版本让这些执行 agent 按同一规则继承 defaultModel，同时把 Vercel AI SDK 的 peer range 扩到 v6 1。

这类框架的选型问题不在「能不能拆任务」，而在两件事：第一，coordinator 生成的 DAG 是否足够稳定；第二，失败后的 replay 和审计能否让工程师定位到哪一步错了。Open Multi-Agent 把计划作为数据交给 deterministic scheduler 执行，这个方向对后者有帮助，但真实项目里还要看 checkpoint、人工插入和权限边界做得多细。

2. Orca：多 agent 工作台正在从玩具变成桌面工具

Orca 本周的信号来自两边：TypeScript Trending 周榜给出 2,769 个窗口新增 star 3；v1.4.104 又在 6 月 28 日合入一批偏桌面体验的修复，包括移动端直接终端输入、移动端特殊键映射、Qwen Code 可执行文件检测、Windows PowerShell 启动、终端冻结恢复、分支 worktree 的 PR 状态展示等 4。

这不是典型的 agent runtime。Orca 更像 agent development environment：把 Codex、Claude Code、OpenCode 或 Pi 放到多个 worktree 里并行跑，再用桌面端和移动端统一盯住状态 5。如果团队已经开始把「一个需求拆给多个 coding agent 同时做」当成日常动作，工作台价值会比再换一个 agent SDK 更直接。

风险也很清楚：它会成为开发者工作流的中枢。你需要确认它对现有 Git 策略、CI 状态、权限请求和本地密钥的处理足够透明。否则 agent 跑得越多，排查成本越高。

3. Agent-Native：把 agent 能力埋进产品，不只是在旁边放一个 chat

BuilderIO 的 Agent-Native 本周没有大版本更新，release 主要是 @agent-native/[email protected] 的 patch 和 core 依赖推进 6。它仍然值得进入本期，原因是周榜信号和定位：仓库说自己提供 shared actions、SQL-backed state、identity、tools、skills、jobs、observability、UI surfaces 这些「产品级 agentic software」primitive 7。

这条路线和 Open Multi-Agent 的问题不一样。Open Multi-Agent 更关心「任务如何编排」；Agent-Native 更关心「agent 怎么成为 app 的一部分」。如果你的产品里需要 agent 调用真实业务动作、写入状态、挂后台 job、在 UI 上给用户可解释反馈，Agent-Native 的问题域更贴近。

反过来说，如果你只是想让 agent 跑一次脚本、改一个 repo，Agent-Native 可能太重。它适合正在把 agent 做成产品能力的团队，不适合只需要自动化脚手架的个人项目。

4. codebase-memory-mcp：上下文检索继续往 MCP 层下沉

codebase-memory-mcp 本周的窗口新增 star 达到 8,926，热度很高 8。不过它的最新 release v0.8.1 发布时间是 6 月 12 日，不在本期窗口内；这里按「窗口外但本周明显升温」补录。

它的核心卖点是把代码库索引成持久知识图谱，给 coding agent 提供低延迟查询。仓库 README 标称支持 158 种语言、sub-ms 查询，并把 token 使用减少 99% 10。v0.8.1 的 release notes 则把图形 UI 的 HTTP server 重写成第一方模块，强调 localhost-only、严格 HTTP/1.1 解析、请求大小上限、单连接单请求，并保留 5,604 个测试 9。

这类工具要用工程指标判断，不能只看 README 的性能数字。POC 里至少测四件事：大仓库首次索引时间、增量更新延迟、跨语言 symbol 查询准确率、agent 在真实任务里少读了多少无关文件。能过这四关，才值得放到默认 MCP 工具列表。

5. SkillSpector 与 AWS Toolkit：skills 生态开始需要供应链治理

NVIDIA SkillSpector 的 README 说得很重：AI agent skills 被 Claude Code、Codex CLI、Gemini CLI 等工具以隐式信任方式执行，而 SkillSpector 要在安装前检测漏洞、恶意模式和安全风险。它列出的能力包括 68 个检测模式、17 类风险、两阶段分析、OSV 实时漏洞查询、Markdown/JSON/SARIF 输出、风险评分和 baseline 抑制 12。

AWS Agent Toolkit for AWS 则从云厂商侧给出另一种信号：它不是单个 MCP server，而是一组 MCP servers、skills、plugins 和规则，覆盖 Claude Code、Codex、Cursor、Kiro 等入口；README 还建议 Kiro 的 MCP 配置 pin 到具体版本，以保证可复现并降低供应链风险 13。

两件事放在一起看，skills 生态正在进入「包管理」阶段。安装入口越来越顺，风险也会越来越像 npm、PyPI：依赖投毒、权限过大、提示注入、数据外传、工具滥用。未来一段时间，agent 框架的竞争不会只发生在 runtime API，也会发生在 marketplace、权限声明、审计日志和扫描器上。

社区观察：三个小工具暴露了 agent 工程的日常摩擦

Hacker News 本周的 Show HN 里，几个小项目比大框架更能说明开发者卡在哪里。

Workweave Router 在 HN 拿到 209 points、111 comments，作者把它描述成可直接接入 Claude Code、Codex、Cursor 的模型路由器，并声称内部使用一个月后 token 成本节省 40% 14。它没有 GitHub release，仓库页也显示暂无 releases，所以更适合当作「成本路由」方向的社区样本，而不是本期主角 15。
Adrafinil 在 HN 拿到 120 points、76 comments，解决的是 Mac 合盖后 coding agent 被睡眠打断的问题；6 月 29 日的 1.2.0 release 又加入了菜单栏定时保持唤醒 16 17。这类工具很小，但说明 agent 已经开始跑到「人睡了，任务还在跑」的时间尺度。
peerd 在 HN 拿到 74 points、23 comments，作者把它定位成完全运行在浏览器扩展里的 agent harness，利用浏览器 sandbox、WebCrypto、WebRTC、WebGPU 等原语，同时承认仍是 v0.x preview 18。这条线值得观察，因为它绕开了「本地进程 + MCP」的默认答案。

这些项目未必都会长成框架，但它们指向同一个事实：agent 工程的瓶颈正在下沉到成本、休眠、权限、沙箱、上下文和多会话管理。框架层只解决一部分问题。

本期选型矩阵

你的问题	优先看	暂缓理由
TypeScript 后端想让 agent 根据目标动态拆 DAG	Open Multi-Agent	如果工作流必须完全可预测，LangGraph 这类显式图仍然更可控
同时跑多个 coding agent、多个 worktree，需要集中看状态	Orca	如果团队还没有并行 agent 工作流，桌面工作台会引入额外习惯成本
把 agent 做进 SaaS 产品，需要状态、身份、后台任务和 UI surface	BuilderIO Agent-Native	如果只是 CLI 自动化，先用轻框架或脚本更快
coding agent 经常读错文件、上下文成本高	codebase-memory-mcp	需要用自家仓库测索引质量，不要只信通用 benchmark
团队开始安装第三方 skills / plugins	SkillSpector + 固定版本策略	安全扫描不能替代权限隔离，尤其是会接触凭证和生产资源的 agent
AWS 项目里想给 agent 标准化工具、规则和服务知识	AWS Agent Toolkit for AWS	要先确认插件市场、MCP server 和本地凭证策略是否符合团队安全要求

下周继续看什么

第一，动态 DAG 框架能否把「生成计划」和「执行审计」做得足够硬。第二，skills / plugins marketplace 会不会出现更明确的权限声明和签名机制。第三，model router、codebase memory、browser sandbox 这些周边工具，是否会被主流 runtime 吸收进默认栈。

如果你只想本周试一个东西，我会优先选 Open Multi-Agent 或 Orca：前者代表 runtime 方向，后者代表开发者工作台方向。它们解决的问题不同，但都比「又封装一次 LLM 调用」更接近 agent 工程的真实短板。

第 4 期｜动态 DAG、并行工作树与技能安全：Agent 工程栈开始补日常短板