
AI 智能体正在学会「带着说明书上班」——Agent Skills 是什么,PM 该怎么看?
AI 智能体从「每次从头配」变成了「按需挂载专业技能模块」。Anthropic 的 Agent Skills 已有 62,000+ GitHub stars、Atlassian/Notion/Canva 等大厂接入。本期把这项技术翻译成 PM 语言:它解决了什么痛点、和工具调用/MCP 有什么区别、以及今天可以做的三件具体产品动作。

리서치 브리프
最近两个月,工程师们在 GitHub 上为一个新项目点了超过 62,000 颗星1。这个项目不是新模型,也不是新框架,而是一套给 AI 智能体「配说明书」的标准规范:Agent Skills(智能体技能)。
这件事对 PM 的意义是:AI 智能体从「能做很多事但每次都要从头配」变成了「按需挂载专业技能模块」。这直接影响你怎么设计 AI 产品的能力边界。
技术是什么
把 Agent Skills 的核心思路浓缩成一句话:给智能体写「岗位 SOP 文件夹」,让它在接到任务时自动取来读。
Anthropic 工程师 Barry Zhang 的比喻很贴切:「写一个 Skill 就像给新员工准备入职手册」2。
技术上,一个 Skill 是一个文件夹,核心是一个
SKILL.md 文件,包含:- YAML 元数据(名称、描述):智能体启动时预加载,让它知道「我有这个技能」,不占用正式上下文
- 正文说明:被触发时才完整读入,包含具体操作指南
- 附属文件(脚本、参考文档):按需深入,只在具体子任务时读取
这种「按需展开」的设计叫渐进式披露(Progressive Disclosure),解决了一个之前一直存在的痛点:把所有能力说明塞进系统提示词,context window 会撑爆;但什么都不说,智能体又不知道怎么做专业任务。
架构图:三级渐进披露,第一级仅加载元数据(数十 token),第二级按需加载完整说明,第三级按需加载附属脚本与文档 3
和「工具调用(Tool Use)」有什么不同?
| 维度 | 工具调用 | Agent Skills |
|---|---|---|
| 基本单位 | 单个函数(输入→输出) | 文件夹(说明书 + 脚本 + 参考资料) |
| 修改什么 | 智能体的输出 | 智能体的准备状态和权限 |
| 类比 | 给你一把螺丝刀 | 给你一本「如何修电器」操作手册,顺手附带所有工具 |
| 组合方式 | 一次调用一个 | 自动识别并叠加多个 Skill |
和 MCP 是什么关系?
MCP(Model Context Protocol)解决的是「智能体怎么连外部系统」,Agent Skills 解决的是「智能体怎么知道在哪个场景下用哪些工具、怎么用」。两者是互补层,不是竞争关系3。
解决什么问题
在 Agent Skills 出现之前,把智能体部署到专业场景有三种选项,都不太好用:
- 微调:成本高、周期长、一个场景一个模型、更新困难
- 在系统提示词里塞说明:Context window 有限,专业场景说明一多就稀释掉通用能力
- RAG:能引入外部知识,但检索到的是被动文本,不能指定工作流、不能执行代码
Agent Skills 的路径是:把「怎么处理这类任务」的程序性知识打包成可复用的标准模块,智能体按需挂载。
数据可以量化这个价值。浙大综述引用的 SAGE 强化学习实验中,使用技能库的智能体在 AppWorld 任务集上3:
- 任务完成率提升 8.9 个百分点
- 生成 token 数减少 59%——直接对应 API 成本
日本电商集团乐天(Rakuten)的管理会计团队使用技能库处理财务报表:原来一天的工作,现在一小时完成4。
一个更大的格局变化
过去,专业化智能体通常意味着「一个场景,一套独立系统」,维护成本高、能力孤岛多。Skills 的本质变化是:同一个通用智能体,可以按需成为财务助手、法务助手、代码审查员——切换靠挂载不同技能包,不靠换底层模型。
产品落地路径:PM 能直接干的三件事
以下是从技术到产品决策的推导链,每一步都给出具体落点。
第一件事:用 Skills 替代「一次性大型 System Prompt」
现象:很多 AI 产品的 system prompt 已经写了几千字,维护困难,效果还不稳定。
技能层的改法:把 system prompt 拆成独立技能模块——一个处理报表格式、一个处理术语规范、一个处理审批流程说明。按场景触发,不相关的场景不加载。
什么时候值得做:你的系统提示词超过 1000 字,且用户使用场景差异明显(比如财务 vs 运营 vs 销售分别触发不同说明)。
第二件事:把「公司内部 SOP」变成技能包
现象:公司流程文档、品牌规范、专有操作手册散落在 Confluence、Wiki 或 PDF 里,AI 每次都检索不准。
技能层的改法:把关键 SOP 整理成 Skill 文件夹。Brand Guideline、合规检查清单、数据处理步骤各成一个 Skill,工程师一次接入,全员可用。
注意点:Skills 目前支持执行代码。一个社区安全研究发现,42,447 个社区技能中有 26.1% 包含安全漏洞3。企业内部自建的 Skill 问题不大,从公开市场引入的第三方 Skill 要先审计代码,这不是过度谨慎,是标准操作。
第三件事:评估智能体产品的能力上限时换一个框架
旧框架:「这个模型能不能做 X?」(能力是静态的,由模型版本决定)
新框架:「这套技能库能不能支撑 X?」(能力是动态的,由技能包决定,可以无需换模型就升级)
这对竞品分析、需求优先级、以及跟 AI 供应商谈判,都影响判断角度。比如:一个竞对产品的某项能力看起来「特别强」,下一步该问的不是「他们用的什么模型」,而是「他们有没有特定领域的技能包」。
当前状态与关注点
Agent Skills 于 2025 年 10 月 16 日由 Anthropic 发布,2025 年 12 月 18 日作为开放标准对外发布,代码仓库地址 agentskills.io2。目前已在 Claude.ai、Claude Code、API 平台全面落地,Atlassian、Figma、Canva、Stripe、Notion 均已发布合作伙伴技能包。
浙大综述指出当前技能层面临两个实际上限值得追踪3:
- 技能库规模存在相变点:技能包数量超过某个临界值后,智能体的路由准确率会急剧下降——意味着技能包越堆越多未必越好,精简和分层管理同样重要
- 跨平台可移植性仍在完善中:当前为 Claude 写的 Skill 可能依赖 Claude 特有行为,移植到其他大模型平台需要适配
这两点不影响今天就开始试的判断,但影响你在 Skill 库的规划和技术选型时要留的灵活度。

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.