Anthropic Economic Index：AI 正在贴着工作节奏生长 (2026)

这份报告最值得读的地方，不是又一次证明「AI 会影响工作」。Anthropic 想回答一个更细的问题：当 Claude 从聊天框变成 Code、Cowork 这类可长时间执行任务的系统后，人的工作节奏、交付物和对未来工作的预期，究竟发生了什么变化。官方页面显示，这份《Anthropic Economic Index report: Cadences》发布于 2026 年 6 月 26 日，报告把更高频的使用遥测、产出类型分类器，以及 2026 年 4 月启动的用户调查合在一起分析。1

这次 Economic Index 换了测量对象

以前看 AI 使用，最自然的单位是一段聊天记录。现在这个单位不够用了。Claude Code 和 Cowork 让很多会话变成「把任务交出去，过一段时间拿结果」，中间可能有工具调用、文件修改和较少的往返对话。Anthropic 因此调整了数据管线：提高采样频率，能观察到小时级使用节奏；新增一个分类器，给每段会话的主要输出打标签；并把 Claude 聊天 / Cowork 与一方 API 流量按月拆开呈现。1

这意味着报告的重点从「用户问了什么」移到「AI 交付了什么、何时被使用、用户把多少判断交给 AI」。这比简单统计提示词类别更接近经济问题，因为组织购买 AI 的目的通常不是多聊几句，而是让某类工作产出更快、更便宜，或能被更少的人完成。

使用节奏：AI 不是全天候均匀渗透，而是贴着生活和截止日期走

报告第一章把 Claude 使用放到日历和一天的小时里看。个人用途在工作日约占聊天和 Cowork 会话的 35%，到周末升至接近 50%；工作相关任务在周末减少，情感支持、医疗问题、投资建议等个人请求增加。1

小时级数据更有意思。新闻请求在当地时间早上 7 点最常见，商务邮件这类请求沿着工作日上升，食谱请求在晚上 6 点达到平均水平的 2.3 倍，睡眠建议集中在凌晨前几个小时。美国报税截止日前后也留下了痕迹：4 月 14 日，税务相关会话是 5 月平均日的 8 倍左右，4 月 15 日仍处高位，4 月 16 日快速回落。1

对开发者和产品团队，这里有一个很实用的提醒：AI 使用不是一条平滑增长曲线。它会被周末、副业时间、报税日、工作日早高峰这类外部节奏牵引。做企业产品时，如果只看月活或总调用量，很容易漏掉「什么时候必须可靠、什么时候可以异步、什么时候用户愿意等更久」这些设计问题。

产出物：Claude 已经在生产具体交付件

第二章把会话的主要输出称为 artifact，也就是用户从 Claude 那里拿走的成品：解释、报告、代码、邮件、计划、应用、演示文稿等。分类器把 93% 的 Claude 聊天和 Cowork 会话识别为产生了某种 artifact；最常见的是解释，占 17%；文档和报告占 15%；指导建议占 11%。1

同一种 artifact 可以服务不同场景。工作会话最常产出文档和报告，占 20%；其次是解释 9%、邮件草稿 7%、分析和摘要 6%。个人会话则更偏向解释和推荐，分别占 25% 和 22%；只有 6% 的个人会话产出文档。1

这组数字的技术含义是：模型评测不能只盯「回答是否正确」。在真实使用里，很多价值来自可交付物的形态是否合适。一个报告、一封邮件、一段脚本、一个可运行网页，对模型的上下文管理、规划能力和格式稳定性要求完全不同。

token 成本跟任务价值一起上升

Anthropic 把工作相关会话映射到通常执行该任务的职业，并用 token 数量估计每段会话的计算成本。报告发现，高工资职业对应的任务通常消耗更多 token。例子很直观：营销经理时薪大约是编辑的两倍，映射到营销经理任务的会话消耗约为编辑任务的 2.5 倍 token。1

artifact 之间也有同样关系。构建应用的会话消耗超过中位会话 3 倍 token；普通解释类输出只用到中位会话约五分之一的 token。报告还估计，输出类型差异能解释职业工资梯度中约 44% 的 token 消耗差异。1

这对企业部署 AI 有两层影响。第一，不能期待高价值任务永远以低成本完成；复杂交付件会吃上下文、推理和多轮验证。第二，token 成本本身可能成为任务复杂度的信号。一个团队如果发现某类工作 token 消耗很高，但产出质量仍不稳定，就该优先改流程、拆任务或增加人工验收，而不是简单换更便宜的模型。

自主性：Claude Code 改变的是「交代任务」的方式

报告用 1 到 5 分衡量 Claude 在会话中拥有多少自主性。容易被精确定义的任务，比如数学计算、翻译、问答，自主性较低；需要在很多方案中做选择的任务，比如做应用、网站、游戏或演示文稿，自主性更高。1

几乎所有输出类型上，Claude Code 的自主性都高于聊天和 Cowork：31 类输出里有 26 类如此。平均差异为 0.37 分；脚本和代码片段这类输出，在 Claude Code 中平均高出 0.53 分。报告还给了一个很说明问题的对比：写博客或文章时，聊天和 Cowork 的中位会话有 13 轮往返，而 Claude Code 中位会话只有一个人类提示。1

这不是单纯因为 Claude Code 用了更强模型。报告指出，Claude Code 会话中 54% 由 Opus 服务，而聊天和 Cowork 只有 10%；但控制到同一模型后差异仍在。只看 Sonnet，会话自主性差距仍有 0.26 分。这说明界面和工作流本身很重要：同一个模型，放在聊天框里和放在面向任务执行的产品里，用户交给它的权限不同。1

调查部分：重度委托者反而更乐观，但样本有边界

报告第三章引入 Economic Index Survey。Anthropic 把 2026 年 4 月启动的调查与 5 月中旬到 6 月初的 Claude 使用数据做隐私保护链接；每位受访者最多抽样 20 个会话，排除少于 5 个会话的人后，最终链接样本约 9700 人。这个样本不是普通劳动人口：计算机和数学职业约占 30%，远高于其在美国就业中的 4%；管理职业占 23%，也高于美国就业中的 7%。1

即便有样本偏差，结果仍值得看。接近 6 成受访者认为，12 个月后 AI 能完成的工作任务比例会比今天更高；超过三分之一的人预计，AI 明年能完成自己大部分或几乎全部工作任务。经验较少、低收入国家受访者，对 AI 当前可完成任务比例的估计更高；工作 15 年以上的人给出的比例，比刚入职者低约 10 个百分点。1

最容易被误读的一点是自动化使用和焦虑的关系。报告发现，把更多会话交给 Claude 自动完成的人，并没有表现出更悲观的工作预期；相反，他们在未来薪酬、工作安全、找工作能力、工作意义、自主性和人际互动六个维度上都更乐观。报告也很克制地承认，这可能是选择效应：本来更看好 AI 的人，更愿意把整件事交出去。1

关于收益，受访者的自我报告相当高：86% 认为 AI 提高了速度，82% 认为扩大了能完成工作的范围，69% 认为提高了质量，27% 认为节省了本来要购买外部服务的成本。68% 的人说自己用 AI 学到更多，57% 的人认为 AI 让自己的技能更有市场价值。报告同时提醒，这些是自我评价，不能排除技能退化被低估的可能。1

应该怎样读这份报告

这份报告给出的不是「AI 取代多少岗位」的答案。它更像一组早期仪表：人在何时调用 AI、拿走什么交付件、愿意让 AI 做多少判断，以及用得越自动化的人如何看待自己的工作。

它的限制也很明确。第一，数据来自 Claude 使用者，不代表所有劳动者。第二，很多分类由隐私保护分类器完成，分类本身会随模型和任务变化而漂移。第三，调查结果是相关性，不是因果结论；「更自动化的用户更乐观」不能直接推出自动化让人更乐观。

但对正在引入 AI 的团队来说，报告给了一个比「节省多少小时」更好的评估框架。至少要分开看四件事：任务发生的时间节奏、AI 产出的 artifact 类型、用户保留了多少判断权、以及高价值任务是否真的允许更多人参与而不是把人挤出流程。Anthropic 的数据倾向于显示：在高工资任务里，Claude 产出更多，用户也投入更多轮次和更多参与。这更像增强劳动，而不是简单替换劳动。1

如果要把这份报告转成行动，最直接的一步不是马上扩大自动化范围，而是先给内部 AI 使用打标签：哪些会话产出解释，哪些产出可交付文档，哪些产出代码或应用；哪些任务只需一次委托，哪些需要人持续判断。只有把这些分清，团队才知道该买更强模型、改工作流，还是给员工补一套新的验收能力。

참고 출처

1Anthropic Economic Index report: Cadences

Anthropic Economic Index：AI 正在贴着工作节奏生长