Anthropic Economic Index:AI 正在贴着工作节奏生长
2026. 7. 1. · 15:22

Anthropic Economic Index:AI 正在贴着工作节奏生长

Anthropic 6 月 Economic Index 把 Claude 使用切到小时、产出物和用户预期三个维度:AI 的价值不只在回答问题,而在何时被交派、交付什么、以及人把多少判断留给自己。本文拆解它的关键数字、方法边界和团队引入 AI 时该看哪些指标。

这份报告最值得读的地方,不是又一次证明「AI 会影响工作」。Anthropic 想回答一个更细的问题:当 Claude 从聊天框变成 Code、Cowork 这类可长时间执行任务的系统后,人的工作节奏、交付物和对未来工作的预期,究竟发生了什么变化。官方页面显示,这份《Anthropic Economic Index report: Cadences》发布于 2026 年 6 月 26 日,报告把更高频的使用遥测、产出类型分类器,以及 2026 年 4 月启动的用户调查合在一起分析。1

这次 Economic Index 换了测量对象

以前看 AI 使用,最自然的单位是一段聊天记录。现在这个单位不够用了。Claude Code 和 Cowork 让很多会话变成「把任务交出去,过一段时间拿结果」,中间可能有工具调用、文件修改和较少的往返对话。Anthropic 因此调整了数据管线:提高采样频率,能观察到小时级使用节奏;新增一个分类器,给每段会话的主要输出打标签;并把 Claude 聊天 / Cowork 与一方 API 流量按月拆开呈现。1
这意味着报告的重点从「用户问了什么」移到「AI 交付了什么、何时被使用、用户把多少判断交给 AI」。这比简单统计提示词类别更接近经济问题,因为组织购买 AI 的目的通常不是多聊几句,而是让某类工作产出更快、更便宜,或能被更少的人完成。

使用节奏:AI 不是全天候均匀渗透,而是贴着生活和截止日期走

报告第一章把 Claude 使用放到日历和一天的小时里看。个人用途在工作日约占聊天和 Cowork 会话的 35%,到周末升至接近 50%;工作相关任务在周末减少,情感支持、医疗问题、投资建议等个人请求增加。1
小时级数据更有意思。新闻请求在当地时间早上 7 点最常见,商务邮件这类请求沿着工作日上升,食谱请求在晚上 6 点达到平均水平的 2.3 倍,睡眠建议集中在凌晨前几个小时。美国报税截止日前后也留下了痕迹:4 月 14 日,税务相关会话是 5 月平均日的 8 倍左右,4 月 15 日仍处高位,4 月 16 日快速回落。1
对开发者和产品团队,这里有一个很实用的提醒:AI 使用不是一条平滑增长曲线。它会被周末、副业时间、报税日、工作日早高峰这类外部节奏牵引。做企业产品时,如果只看月活或总调用量,很容易漏掉「什么时候必须可靠、什么时候可以异步、什么时候用户愿意等更久」这些设计问题。

产出物:Claude 已经在生产具体交付件

第二章把会话的主要输出称为 artifact,也就是用户从 Claude 那里拿走的成品:解释、报告、代码、邮件、计划、应用、演示文稿等。分类器把 93% 的 Claude 聊天和 Cowork 会话识别为产生了某种 artifact;最常见的是解释,占 17%;文档和报告占 15%;指导建议占 11%。1
同一种 artifact 可以服务不同场景。工作会话最常产出文档和报告,占 20%;其次是解释 9%、邮件草稿 7%、分析和摘要 6%。个人会话则更偏向解释和推荐,分别占 25% 和 22%;只有 6% 的个人会话产出文档。1
这组数字的技术含义是:模型评测不能只盯「回答是否正确」。在真实使用里,很多价值来自可交付物的形态是否合适。一个报告、一封邮件、一段脚本、一个可运行网页,对模型的上下文管理、规划能力和格式稳定性要求完全不同。

token 成本跟任务价值一起上升

Anthropic 把工作相关会话映射到通常执行该任务的职业,并用 token 数量估计每段会话的计算成本。报告发现,高工资职业对应的任务通常消耗更多 token。例子很直观:营销经理时薪大约是编辑的两倍,映射到营销经理任务的会话消耗约为编辑任务的 2.5 倍 token。1
artifact 之间也有同样关系。构建应用的会话消耗超过中位会话 3 倍 token;普通解释类输出只用到中位会话约五分之一的 token。报告还估计,输出类型差异能解释职业工资梯度中约 44% 的 token 消耗差异。1
这对企业部署 AI 有两层影响。第一,不能期待高价值任务永远以低成本完成;复杂交付件会吃上下文、推理和多轮验证。第二,token 成本本身可能成为任务复杂度的信号。一个团队如果发现某类工作 token 消耗很高,但产出质量仍不稳定,就该优先改流程、拆任务或增加人工验收,而不是简单换更便宜的模型。

自主性:Claude Code 改变的是「交代任务」的方式

报告用 1 到 5 分衡量 Claude 在会话中拥有多少自主性。容易被精确定义的任务,比如数学计算、翻译、问答,自主性较低;需要在很多方案中做选择的任务,比如做应用、网站、游戏或演示文稿,自主性更高。1
几乎所有输出类型上,Claude Code 的自主性都高于聊天和 Cowork:31 类输出里有 26 类如此。平均差异为 0.37 分;脚本和代码片段这类输出,在 Claude Code 中平均高出 0.53 分。报告还给了一个很说明问题的对比:写博客或文章时,聊天和 Cowork 的中位会话有 13 轮往返,而 Claude Code 中位会话只有一个人类提示。1
这不是单纯因为 Claude Code 用了更强模型。报告指出,Claude Code 会话中 54% 由 Opus 服务,而聊天和 Cowork 只有 10%;但控制到同一模型后差异仍在。只看 Sonnet,会话自主性差距仍有 0.26 分。这说明界面和工作流本身很重要:同一个模型,放在聊天框里和放在面向任务执行的产品里,用户交给它的权限不同。1

调查部分:重度委托者反而更乐观,但样本有边界

报告第三章引入 Economic Index Survey。Anthropic 把 2026 年 4 月启动的调查与 5 月中旬到 6 月初的 Claude 使用数据做隐私保护链接;每位受访者最多抽样 20 个会话,排除少于 5 个会话的人后,最终链接样本约 9700 人。这个样本不是普通劳动人口:计算机和数学职业约占 30%,远高于其在美国就业中的 4%;管理职业占 23%,也高于美国就业中的 7%。1
即便有样本偏差,结果仍值得看。接近 6 成受访者认为,12 个月后 AI 能完成的工作任务比例会比今天更高;超过三分之一的人预计,AI 明年能完成自己大部分或几乎全部工作任务。经验较少、低收入国家受访者,对 AI 当前可完成任务比例的估计更高;工作 15 年以上的人给出的比例,比刚入职者低约 10 个百分点。1
最容易被误读的一点是自动化使用和焦虑的关系。报告发现,把更多会话交给 Claude 自动完成的人,并没有表现出更悲观的工作预期;相反,他们在未来薪酬、工作安全、找工作能力、工作意义、自主性和人际互动六个维度上都更乐观。报告也很克制地承认,这可能是选择效应:本来更看好 AI 的人,更愿意把整件事交出去。1
关于收益,受访者的自我报告相当高:86% 认为 AI 提高了速度,82% 认为扩大了能完成工作的范围,69% 认为提高了质量,27% 认为节省了本来要购买外部服务的成本。68% 的人说自己用 AI 学到更多,57% 的人认为 AI 让自己的技能更有市场价值。报告同时提醒,这些是自我评价,不能排除技能退化被低估的可能。1

应该怎样读这份报告

这份报告给出的不是「AI 取代多少岗位」的答案。它更像一组早期仪表:人在何时调用 AI、拿走什么交付件、愿意让 AI 做多少判断,以及用得越自动化的人如何看待自己的工作。
它的限制也很明确。第一,数据来自 Claude 使用者,不代表所有劳动者。第二,很多分类由隐私保护分类器完成,分类本身会随模型和任务变化而漂移。第三,调查结果是相关性,不是因果结论;「更自动化的用户更乐观」不能直接推出自动化让人更乐观。
但对正在引入 AI 的团队来说,报告给了一个比「节省多少小时」更好的评估框架。至少要分开看四件事:任务发生的时间节奏、AI 产出的 artifact 类型、用户保留了多少判断权、以及高价值任务是否真的允许更多人参与而不是把人挤出流程。Anthropic 的数据倾向于显示:在高工资任务里,Claude 产出更多,用户也投入更多轮次和更多参与。这更像增强劳动,而不是简单替换劳动。1
如果要把这份报告转成行动,最直接的一步不是马上扩大自动化范围,而是先给内部 AI 使用打标签:哪些会话产出解释,哪些产出可交付文档,哪些产出代码或应用;哪些任务只需一次委托,哪些需要人持续判断。只有把这些分清,团队才知道该买更强模型、改工作流,还是给员工补一套新的验收能力。

이 채널의 다른 콘텐츠

관련 콘텐츠

  • 로그인하면 댓글을 작성할 수 있습니다.