25 人公司跑 44 个 Agent：AI 创业者正在怎样重构自己的团队

这不是未来趋势的预测文章。这是一批已经在用 AI 重构团队的创业者，把他们踩过的坑、跑通的流程、以及改变工作方式的具体实验，汇集成的一份实操参考。

时间节点是 2026 年 4 月底至 5 月初。

一、用 4 个 Agent 替代人工统筹

Every 是一家 25 人的媒体公司，他们用 Notion AI 搭建了 4 个定制 Agent，直接替代了原本依赖人工协调的统筹工作1。

其中最核心的一个叫 Anton，接入了公司战略文档、OKR 数据库、统一日历以及人员—团队—角色映射数据库，每天在 Slack 发送本周优先级播报。另外三个 Agent 分别处理会议记录、OKR 规划和增长追踪。

真正让这套系统跑起来的，是 Every CEO 描述目标的方式：

向 AI 描述你想要的结果，而不是具体的操作步骤。

这句话听起来简单，但实际执行时反差很大。很多团队习惯给 AI 下操作指令——「先做这个再做那个」——结果 Agent 变成了高级执行工具，而不是真正的自主协作者。Every 的逻辑是反过来的：先把公司的互联数据库建好，让 Agent 有足够的上下文，然后只告诉它目标，让它自己找路径。

二、单人 PM 用 Claude Code 生成 100 份工单

Spiral 总经理 Marcus Moretti 的案例更激进一些——他一个人，用 Claude Code 完成了原本需要整个产品管理团队协作的工作2。

具体流程是这样的：

撰写详细产品路线图，提交到 GitHub README
Claude Code 读取 README，对路线图提出调整反馈
产品经理迭代打磨路线图
Claude Code 结合路线图、用户反馈、代码库和使用数据，批量生成交付所需工单

最后一步花多长时间？十几分钟，约 100 份工单，每份都包含战略背景、支撑数据、验收标准和技术实现说明。

Moretti 配套开发了一个开源插件 compound-engineering-plugin，内置 /ce:strategy 技能，可以自动生成产品路线图。Dan Shipper 在 4 月 30 日把这篇指南推荐给所有人，称其为「必读的决定性指南」3。

一个人做了多个人的活，这只是表层。更值得注意的是 Moretti 把对话本身当作产品工作的载体——原本散落在 10 个应用里的协作流程，现在在一个对话线程里完成。产品经理不再跳出去查工具、写模板、协调确认，而是留在那个状态里，把精力放在真正需要判断的地方。

三、AI 项目经理上岗，每周节省 15 小时

Every 咨询部给负责人 Natalia 配了一个 AI 项目经理 Claudie，基于 Claude Code 搭建，专门处理高时耗的行政事务——维护客户工作仪表盘、追踪项目进度、从邮件/Google Docs/Sheets/会议记录/日历里收集信息并更新客户数据库4。

实测结果：每周为 Natalia 节省了 15 小时。

但这个过程远没有听起来那么顺。团队淘汰了多个结构不合适的旧版本 Claudie，才找到有效的架构。最大的教训来自初期的失败：他们一开始让 Claudie 像人类新员工一样自主完成全部更新工作，效果很差——根本原因是大模型的上下文窗口限制，单个 Agent 无法稳定处理需要同时感知大量状态的任务。

调整方案是拆分架构：设置一个中心调度代理，把不同任务分派给对应子代理，分别负责提取数据、识别需要更新的内容、执行修改。

他们总结出三条原则，踩过足够多坑之后才确认管用：

先明确岗位，再配置 AI：Agent 只能基于你给它的上下文和工具完成工作，岗位不清晰，Agent 就没有边界
匹配 AI 的工作特性调整架构，而不是强行套用人类的工作模式
权限要提前开放：会议记录、表格、日历的访问权限，一个都不能少

四、44 个 Agent，「文件夹即 Agent」

Cora 总经理 Kieran Klaassen 目前运行 44 个 AI Agent5。

他用的架构叫「文件夹即 Agent」：把项目文件夹加上配置和上下文沉淀，改造成专属智能体，通过自建 Ruby 守护进程调度层来管理。这 44 个 Agent 里有两类核心角色：

研发 Agent：内置 Rails 开发规范、部署流程、数据库模式，还有完整系统架构文档、故障处理手册，以及评审者、规划者、组件创建者等细分专家智能体。

运维 Agent：接入 AppSignal 错误监控、Render 日志、Postgres 只读副本、Intercom 客户工单、GitHub 部署和生产故障关联能力。

日常调度流程很具体：早晨用 /hey 命令检查所有 Agent 的已完成任务、错误和阻塞状态；用 /orchestrate 命令启动任务，由 lead Agent 拆解子任务到文件，守护进程分发到对应文件夹，Worker 继承所在文件夹全部上下文独立执行，每 60 秒检查状态，结果汇总生成 Pull Request。

Klaassen 对一件事说得很直接：不能随意编排 Agent。他的顺序是先搭建文件夹，人工使用验证流程，确认可以信任后，再交给调度层编排。不能跳过人工验证直接调度。

实际踩过的坑包括：特殊字符编码崩溃、上下文漂移导致重复工作、Agent stall（卡住无法自动发现，需要人工干预）。这三类问题听起来都是细节，但在 44 个 Agent 并发运行的情况下，任何一个不处理都会影响整体节奏。

五、无技术背景，也能搭建 80 个工作流技能

Every 增长负责人 Austin Tedesco 没有技术背景，但他用 Claude Code 搭建了自己的工作指挥中心 Agent——Montaigne6。

接入工具清单：Stripe、PostHog、ChartMogul、Slack、Notion、Figma、Every 产品套件、邮箱、日历。内置超过 80 个可复用工作流技能。部署位置是 Claude Code 终端和 Slack OpenClaw 机器人，整个团队都可以使用。

使用方式也不复杂：在 Slack 发一条数据查询，Montaigne 拿数据、带上下文输出，不用手动跨平台搜索；录一段粗略的策略语音笔记，指定相关数据和知识库，Montaigne 在 Notion 里合成方案草稿；还可以生成子 Agent 在后台执行不需要人工干预的计划环节。

Austin 给出了一个很实际的建议：刚开始用 Claude Code 时，不要直接上正式项目，先用自己感兴趣的小东西练手——他自己花了三周做了烹饪陪伴 App 和影院影讯查询工具，才对工具能力有了真实感知。

他还有一个关于节奏管理的细节值得注意：优化系统很容易让人陷进去消耗时间，应该优先让 Montaigne 逐个处理待办清单，同时让子 Agent 在后台处理低优先级任务，快速回归主工作节奏，而不是陷入调优循环。

六、Karpathy：「agentic engineering」是一个新的专业学科

Andrej Karpathy 在 Sequoia Ascent 2026 的演讲里，把 2025 年 12 月定义为 agentic 拐点——从那时起，AI 生成代码块的可靠性跃升，编程工作流发生根本改变7。

他的描述是：「工作单位从写代码行数，变为委派更大的宏观行为。」

Karpathy 把这两件事区分得很清楚：vibe coding（降低编程门槛，盲目接受生成结果）和 agentic engineering（在代理辅助下保持安全性、可维护性和品味）。后者才是他认为需要作为专业学科去建立的能力，包括：设计规范、审视计划、检查 diff（代码变更差异）、编写测试、构建评估循环、管理权限。

他专门提到一个容易出错的场景：在他的 Stripe 支付 bug 案例里，Agent 提议用 email 匹配用户，但 Stripe email 与 Google login email 可能不同，这违反了系统设计原则。Agent 不知道这个边界，只有人知道。Karpathy 的结论：「边界技能仍是人的工作。」

七、从行业数据看 AI 原生组织的效率差距

AI 原生公司人均 ARR 对标（2026 年）

数据来源：ai2roi.substack.com，2026-04-29

Cursor

$0.00

Midjourney

$0.00

Lovable

$0.00

OpenAI

$0.00

传统 SaaS 中位数（2025）

$0.00

正在加载统计卡片...

这个数字差距不是偶然的8。研究者 Peter van Hees 把这个现象命名为「功能溶解原理」：任何可以用规则定义、且结果可以验证的业务功能，都可以自动化9。

但这个数字也有陷阱。Harvey AI 曾经做到人均 $800K ARR（2024 年 3 月），然后因为要适应企业销售模式大规模扩招 1260%，人均 ARR 跌到 $170K（2026 年 1 月）。客户成功、销售、法务合规这些职能，用 AI 还替代不了8。

Model ML CEO Chaz Englander 把 AI 原生企业的组织形态描述为「控制塔」而非传统孤岛层级：更少层级、更快循环、扁平架构，创始人直接管理数十名下属，所有一对一沟通由 AI 辅助，纪要、待办、上下文都被流线化10。

读完这些，你可以做什么

上面六个案例，都不是在预测将来。它们是「现在就在跑」的工作流记录。

几条可以直接带走的判断：

Agent 的上限由上下文质量决定。Every 的 Notion 互联数据库、Cora 的「文件夹即 Agent」架构，本质上都是在给 Agent 喂高质量上下文。数据库没建好，Agent 再聪明也没用。
先明确岗位，再配置 AI。AI 只能在给定的工具和上下文范围内工作——这不是限制，而是说明你需要先想清楚这个「岗位」做什么，才能给 AI 正确的工具和边界。
人工验证不是多余步骤。Klaassen 运行 44 个 Agent，但他不会跳过人工验证直接调度。Karpathy 的「边界技能仍是人的工作」说的是同一件事——不是 AI 不行，是你必须先知道边界在哪里。
「Harvey AI 陷阱」是真实风险。精简团队可以实现高人均营收，但一旦转向企业销售，这个优势会迅速收缩。在精简模式和规模化模式之间做选择，需要提前想清楚，而不是等到扩招之后。

这些人没有一个是在等 AI 工具「再成熟一点」。他们在用当下可用的工具，找当下能跑通的工作流。

封面图：图片来自 Pexels by Thirdman

25 人公司跑 44 个 Agent：AI 创业者正在怎样重构自己的团队

一、用 4 个 Agent 替代人工统筹

二、单人 PM 用 Claude Code 生成 100 份工单

三、AI 项目经理上岗，每周节省 15 小时

四、44 个 Agent，「文件夹即 Agent」

五、无技术背景，也能搭建 80 个工作流技能

六、Karpathy：「agentic engineering」是一个新的专业学科

七、从行业数据看 AI 原生组织的效率差距

读完这些，你可以做什么

参考来源