AI 智能体正在学会「带着说明书上班」——Agent Skills 是什么，PM 该怎么看？

最近两个月，工程师们在 GitHub 上为一个新项目点了超过 62,000 颗星1。这个项目不是新模型，也不是新框架，而是一套给 AI 智能体「配说明书」的标准规范：Agent Skills（智能体技能）。

这件事对 PM 的意义是：AI 智能体从「能做很多事但每次都要从头配」变成了「按需挂载专业技能模块」。这直接影响你怎么设计 AI 产品的能力边界。

技术是什么

把 Agent Skills 的核心思路浓缩成一句话：给智能体写「岗位 SOP 文件夹」，让它在接到任务时自动取来读。

Anthropic 工程师 Barry Zhang 的比喻很贴切：「写一个 Skill 就像给新员工准备入职手册」2。

技术上，一个 Skill 是一个文件夹，核心是一个 SKILL.md 文件，包含：

YAML 元数据（名称、描述）：智能体启动时预加载，让它知道「我有这个技能」，不占用正式上下文
正文说明：被触发时才完整读入，包含具体操作指南
附属文件（脚本、参考文档）：按需深入，只在具体子任务时读取

这种「按需展开」的设计叫渐进式披露（Progressive Disclosure），解决了一个之前一直存在的痛点：把所有能力说明塞进系统提示词，context window 会撑爆；但什么都不说，智能体又不知道怎么做专业任务。

架构图：三级渐进披露，第一级仅加载元数据（数十 token），第二级按需加载完整说明，第三级按需加载附属脚本与文档 3

和「工具调用（Tool Use）」有什么不同？

维度	工具调用	Agent Skills
基本单位	单个函数（输入→输出）	文件夹（说明书 + 脚本 + 参考资料）
修改什么	智能体的输出	智能体的准备状态和权限
类比	给你一把螺丝刀	给你一本「如何修电器」操作手册，顺手附带所有工具
组合方式	一次调用一个	自动识别并叠加多个 Skill

和 MCP 是什么关系？

MCP（Model Context Protocol）解决的是「智能体怎么连外部系统」，Agent Skills 解决的是「智能体怎么知道在哪个场景下用哪些工具、怎么用」。两者是互补层，不是竞争关系3。

解决什么问题

在 Agent Skills 出现之前，把智能体部署到专业场景有三种选项，都不太好用：

微调：成本高、周期长、一个场景一个模型、更新困难
在系统提示词里塞说明：Context window 有限，专业场景说明一多就稀释掉通用能力
RAG：能引入外部知识，但检索到的是被动文本，不能指定工作流、不能执行代码

Agent Skills 的路径是：把「怎么处理这类任务」的程序性知识打包成可复用的标准模块，智能体按需挂载。

数据可以量化这个价值。浙大综述引用的 SAGE 强化学习实验中，使用技能库的智能体在 AppWorld 任务集上3：

任务完成率提升 8.9 个百分点
生成 token 数减少 59%——直接对应 API 成本

日本电商集团乐天（Rakuten）的管理会计团队使用技能库处理财务报表：原来一天的工作，现在一小时完成4。

一个更大的格局变化

过去，专业化智能体通常意味着「一个场景，一套独立系统」，维护成本高、能力孤岛多。Skills 的本质变化是：同一个通用智能体，可以按需成为财务助手、法务助手、代码审查员——切换靠挂载不同技能包，不靠换底层模型。

产品落地路径：PM 能直接干的三件事

以下是从技术到产品决策的推导链，每一步都给出具体落点。

第一件事：用 Skills 替代「一次性大型 System Prompt」

现象：很多 AI 产品的 system prompt 已经写了几千字，维护困难，效果还不稳定。

技能层的改法：把 system prompt 拆成独立技能模块——一个处理报表格式、一个处理术语规范、一个处理审批流程说明。按场景触发，不相关的场景不加载。

什么时候值得做：你的系统提示词超过 1000 字，且用户使用场景差异明显（比如财务 vs 运营 vs 销售分别触发不同说明）。

第二件事：把「公司内部 SOP」变成技能包

现象：公司流程文档、品牌规范、专有操作手册散落在 Confluence、Wiki 或 PDF 里，AI 每次都检索不准。

技能层的改法：把关键 SOP 整理成 Skill 文件夹。Brand Guideline、合规检查清单、数据处理步骤各成一个 Skill，工程师一次接入，全员可用。

注意点：Skills 目前支持执行代码。一个社区安全研究发现，42,447 个社区技能中有 26.1% 包含安全漏洞3。企业内部自建的 Skill 问题不大，从公开市场引入的第三方 Skill 要先审计代码，这不是过度谨慎，是标准操作。

第三件事：评估智能体产品的能力上限时换一个框架

旧框架：「这个模型能不能做 X？」（能力是静态的，由模型版本决定）

新框架：「这套技能库能不能支撑 X？」（能力是动态的，由技能包决定，可以无需换模型就升级）

这对竞品分析、需求优先级、以及跟 AI 供应商谈判，都影响判断角度。比如：一个竞对产品的某项能力看起来「特别强」，下一步该问的不是「他们用的什么模型」，而是「他们有没有特定领域的技能包」。

Skills 在 Claude.ai 中的界面——可手动挂载技能，触发后在思维链中可见 — Skills 在 Claude.ai 产品界面中的实际展示 4

当前状态与关注点

Agent Skills 于 2025 年 10 月 16 日由 Anthropic 发布，2025 年 12 月 18 日作为开放标准对外发布，代码仓库地址 agentskills.io 2。目前已在 Claude.ai、Claude Code、API 平台全面落地，Atlassian、Figma、Canva、Stripe、Notion 均已发布合作伙伴技能包。

浙大综述指出当前技能层面临两个实际上限值得追踪3：

技能库规模存在相变点：技能包数量超过某个临界值后，智能体的路由准确率会急剧下降——意味着技能包越堆越多未必越好，精简和分层管理同样重要
跨平台可移植性仍在完善中：当前为 Claude 写的 Skill 可能依赖 Claude 特有行为，移植到其他大模型平台需要适配

这两点不影响今天就开始试的判断，但影响你在 Skill 库的规划和技术选型时要留的灵活度。