Anthropic Economic Index 报告:使用节奏
阅读原文· anthropic.com这是 Anthropic 迄今最详细的 AI 使用经济分析,从使用节律到输出自主性再到用户调查,展示 AI 渗透的真实图景。我最关注调查结果:自动化使用越多的人对职业前景反而更乐观。
Anthropic 发布 Economic Index 报告,基于隐私保护遥测数据分析了 Claude 的使用节奏。工作日个人对话占比约 35%,周末升至近 50%;高薪职业在工作日外的使用占比更高。日内模式显示:新闻请求集中在早上 7 点,食谱在下午 6 点达到 2.3 倍高频,睡眠建议凌晨 3 点最多。税收相关请求在 4 月 15 日美国报税截止日前激增。调查还发现:使用 Claude 最自动化的用户预计 AI 明年将承担更多任务,但对薪资、工作安全及工作意义的预期最为乐观。
经济研究
Anthropic 经济指数报告:节奏
2026年6月26日
阅读 PDF 版本
引言
一年前,大多数 Claude 的使用形式是用户与助手之间的对话。随着 Claude Code 和 Cowork 的快速发展,现在 Claude 会话越来越多地由长时间运行的智能体任务构成。聊天记录已无法完全反映人们如何使用 AI,我们研究 Claude 经济影响的方法也必须随之调整。
为了跟上步伐,我们对经济指数的数据管道进行了几项修改。在这一版本中,我们:
- 以更高的频率采样数据,使我们能够观察到逐小时级别的使用模式。
- 引入了一个新的分类器,用于标注每次对话的输出内容。
- 分享更细粒度的数据,将聊天和 Cowork 对话(合称“Claude 对话”)以及 1P API 的结果分别列出,并按月汇总。¹
我们在附录中描述了其他方法论上的变化。这些变化共同描绘出 AI 如何映射并渗透到经济生活中。
此外,我们此前一直无法了解 Claude 在用户会话之外的影响。人们如何看待 AI 正在改变他们的工作或他们可获得的机会?他们对 AI 的使用是否塑造了他们的预期?在理想情况下,他们希望从 AI 那里得到什么?我们从 2026 年 4 月启动的 Anthropic 经济指数调查中报告了初步发现。
我们在下文中预先展示主要发现。
在第 1 章中,我们展示了外部世界的节律如何塑造 Claude 的使用方式。与工作相关的查询在周末会减少,尽管在高收入职业中减幅不那么明显;人们倾向于在早上询问新闻,而睡眠建议在凌晨 3 点左右达到峰值;与税务相关的请求在报税截止日期前后激增。
第二章探讨了人们从使用Claude的过程中获得的具体输出。这些输出高度依赖于他们所使用的产品。例如,Chat和Cowork提供的解释比Claude Code更多。输出的性质也塑造了人们与Claude的互动方式。与翻译文档相比——翻译文档的答案很大程度上由原文决定——构建网站需要更多地依赖Claude的判断。我们还发现,计算资源越多的会话,产出物价值越高;给定输出所消耗的模型token数量,会随着该工作的预估价值上升而增加。
第三章展示了Anthropic经济指数调查的首批结果,我们通过隐私保护系统将其与Claude使用数据关联起来。期望与体验随着人们使用Claude的方式而系统性地变化:以最高自动化方式使用Claude的人,预期AI在未来一年内会接管他们更多的任务,但同时对其工作前景感到最为乐观,预期在薪酬、工作保障和意义感方面会产生积极影响。
节奏
我们的新型隐私保护遥测技术每天持续采样一部分对话,使我们能够研究使用的每日和每小时模式,而此前的每份经济指数报告都基于七天样本。这些分析捕捉了全球范围内工作模式的起伏变化。
我们发现Claude的使用模式与工作周同步,个人类提示词在周末激增。小时级数据捕捉到日内模式——人们通常在凌晨3点左右询问睡眠建议,在下午6点左右询问食谱。我们还看到使用情况反映了关键日期。例如,在美国报税截止日4月15日之前,与税务相关的请求激增。
工作周
在样本期内,Chat和Cowork对话中被归类为个人使用的比例,从工作日的约35%飙升至周末的近50%(图1.1)。在工作时间之外,用户的对话从商务函件、营销文案和幻灯片转向情感支持、医疗问题和投资建议。这一转变在高收入国家最为显著。

图 1.1:周末个人对话增加。Claude.ai、Claude Desktop、Claude Code 和 1P API 上个人使用对话的每日占比。周六和周日以灰色标出。
Claude Code 和 1P API 流量(即通过 Anthropic 直接路由的 API 流量)中也存在类似模式,尽管两者的个人使用基准率较低。4
请求聚类 5 使我们能够再深入一层,观察哪些具体的 Claude Code 任务在周末和工作日之间波动最大。在周末,下降最多的 Claude Code 使用聚类包括后端架构、API 调试和数据存储;增长最多的包括 AI 智能体设计、量化交易和游戏。
周末也可能为人们创造了追求新事业的时空。在各国家中,与创业相关的对话在周六和周日最高。然而,求职活动在周末下降,其他工作相关任务也是如此。6
日常节奏
逐小时来看,Claude 的使用情况反映了日常生活的节奏。图 1.2 显示了不同请求聚类相对于全球流量整体平均值的每小时频率。7
人们会在当地时间早上 7 点询问新闻。商务通信(例如起草电子邮件)勾勒出工作日的轨迹,在上午 10–11 点略有峰值。最大的峰值之一是食谱请求,下午 6 点的频率是平均值的 2.3 倍。媒体推荐最集中在晚上,而人们在黎明前几小时寻求睡眠建议。

图 1.2:一天中各时段的请求聚类。不同请求聚类中对话的标准化每小时占比,仅限于 Claude 聊天和 CoWork 数据。
在夜间和周末,当人们确实转向Claude处理工作时,这些任务更倾向于高薪职业(图1.3)。虽然我们无法确切识别提出这些请求的人群的职业,但这可能反映出,高薪职业(如市场营销经理或计算机程序员)的人更可能在非传统工作时间工作。相比之下,与最低两个薪资四分位数职业(如电话推销和文书工作)相关的任务在全部对话中所占份额较小。这种模式并非仅仅由计算机与数学任务驱动:当我们从分析中剔除这些职业进行稳健性检验时,高四分位数的任务在夜间和周末仍然有所增加。

图1.3:夜间和周末工作相关对话占比变化,按职业薪资四分位数划分。每个条形图显示,相较于工作日的上班时间,夜间和周末来自指定薪资四分位数的与工作相关任务占比的百分比变化。薪资四分位数使用美国劳工统计局数据计算,并按对话记录数量加权。
报税日
本报告样本期覆盖了美国居民的报税截止日期。图1.4显示,在截止日期前后,与报税相关的对话占比出现了大幅激增。4月14日,与报税相关的对话簇的常见度是5月平均每日的八倍,4月15日仍保持同样高的水平。4月16日,该比例急剧下降。

图1.4:美国报税截止日期前夕,与报税相关的对话激增。美国及世界其他地区与报税相关的对话占比。
产物
在本章中,我们根据产物对聊天和Cowork(以下简称“Claude对话”)中的每个对话进行分类³,并将产物分为30多个类别。我们将Claude在对话中产生的主要输出——无论是文档、解释、代码、学术论文等,无论是呈现在聊天窗口中还是作为单独文档——称为产物。产物完整列表见附录。
我们的分类器识别出 93% 的 Claude 对话产生了某种 artifact(图 2.1)。最常见的 artifact 是解释说明(占对话的 17%)、文档和报告(15%)以及指导(11%)。对话型输出(如解释或指导)和书面交付物(如文档或演示文稿)各约占对话的三分之一;代码和技术工作(如应用或脚本)约占六分之一。

图 2.1:Claude 的输出。具有特定输出的对话占比。该图展示了 Claude 对话中十二种最常见的输出类型。1P API 混合数据见附录。
输出本身是什么并不能说明它的用途:同一个 artifact 既可能是工作交付物,也可能是个人项目。接下来我们看这种区分。
每个 artifact 分别用于什么?
我们的一月经济指数引入了一个原始分类,将每个对话归类为工作、个人或课程作业。这里,我们将这一区分应用于 Claude 对话产生的 artifact(图 2.2)。
某些类别的 artifact 几乎始终是个人用途。超过 80% 的产生创意写作、指导和食谱的对话被归类为个人用途。在同一类别内,个人用途与工作相关的用途可能差异很大。例如,个人创意写作主要是同人小说、世界观构建和诗歌;其中 13% 的工作相关用途大多以短视频脚本、剧本和演讲稿的形式出现。最可能属于工作相关的类别包括创建营销内容(80%)、创建博客或文章(81%)以及编写数据库查询(82%)。
许多输出同样可能用于个人或工作原因,包括创建计划或策略(44% 工作相关,49% 个人)或翻译(42% 工作,44% 个人)。例如,最常见的个人规划 artifact 包括旅行行程和健身计划,而工作相关规划则最常见于创业或内容策略。
最后,属于课业任务范畴的产物包括撰写学术论文与学位论文、制作教学材料以及处理数学相关问题,尽管其中每个类别都有不小比例同时属于工作与个人用途。

图 2.2:按使用场景划分的产物占比按输出内容的目的将其划分为工作、个人和课业任务三类后,各场景中对话产物的占比分布。
我们也可以换一个角度提问。不问每种输出用于什么,而是问工作、个人和课业任务的对话各自倾向于产生哪些类型的产物。工作类对话最常产生的是文档与报告(20%),其次是解释说明(9%)、邮件草稿(7%)以及分析与总结(6%)。课业任务类对话的分布大致相似,文档与报告仍然占比最高(21%),紧随其后的是解释说明(20%)、教学材料(11%)和学术论文(6%)。相比之下——不出所料——个人类对话中只有6%产生了文档,最常见的输出反而是解释说明(25%)和推荐建议(22%)。
成本反映工作的价值
产生这些输出需要算力,我们发现算力往往随工作价值增长而增加。我们以模型 token(即处理与生成的文本量,包括 Claude 的内部推理)来衡量每段对话的计算成本,并通过将每段对话经分类后的任务映射到通常执行该任务的职业,来比较不同职业间的成本差异。在本节中,我们将分析范围限定在与工作相关的对话上。
图 2.3 的左图显示,对话层面 token 数量中位数与映射职业的工资中位数之间存在正相关关系。例如,营销经理的收入大约是编辑的两倍(每小时 80 美元对比 37 美元),而映射到其任务的对话消耗的 token 数量则约为后者的 2.5 倍。必须承认,这种关系存在波动,且有一些明显的异常值。例如,药剂师的收入几乎是统计助理的三倍(每小时 68 美元对比 24 美元),然而映射到药剂师任务的对话所使用的 token 数量仅约为后者的二十分之一。

图2.3:高薪职业的对话消耗更多token 左图:给定职业的中位工资与该职业所属任务对话中典型(几何平均)token数量之间的关系,已按总体均值归一化。两个变量均采用对数刻度。右图:生成不同工件所消耗的token分布。黑色线表示中位数,箱体表示第25和第75百分位数,须线表示第10和第90百分位数。所有数值均按总体中位数token数归一化,并以对数刻度呈现。两幅图中的数据仅限于聊天和Cowork模式,且仅限被归类为工作相关的对话。token计数未根据服务对话的模型进行调整。
生成不同类型工件所消耗的token揭示了相似的规律。更复杂、更有价值的输出所消耗的token通常远多于简单输出。例如,关于构建应用的对话所消耗的token是中位数对话的三倍以上。而在另一端,典型的解释所消耗的token仅约为中位数对话的五分之一。token消耗中约44%的工资梯度可由输出组合解释——高薪职业更倾向于生成计算密集型的工件。
为什么这在经济上很重要?在映射到高薪职业的对话中,Claude的产出更多(每轮对话输出量是1.34倍),而用户的参与度更高(轮次是1.53倍),并且更频繁地启用扩展思考(对话占比34%对比31%;表2.4)。关键在于,这些趋势是同步的:Claude产出更多并不意味着用户产出减少。如果人类仍然参与最高价值的任务,那么这种模式看起来更像是劳动增强而非劳动替代。这也表明,在一定程度上,更有价值的产出成本更高。下一节将考察每个对话中决策权在多大程度上被委托给了Claude。

表 2.4:高薪职业中 token 消耗量更高的原因分析。映射到高薪职业的对话中,导致 token 消耗量更高的对话特征。职业按中位工资分为三档,并根据每档匹配的对话数量进行加权。计算相关指标已按最低档的几何均值进行了归一化处理。例如,第一行显示,映射到最高档职业的典型对话所消耗的 token 数量,是映射到最低档职业的典型对话的 2.07 倍。
Claude 在自主决策方面拥有多大程度的自主权?
我们按 1 到 5 的等级进行衡量,从“无自主权”到“极高自主权”。容易描述或指定的任务涉及的自主权较少:自主权最低的输出是数学或计算题、翻译以及问答类内容。高自主权任务则需要从众多可能选项中做出选择,例如创建应用程序和网站、游戏或演示文稿。这类需要持续判断的工作历来难以实现自动化。通过比较 Claude 聊天、Cowork 与 Claude Code 中的自主权水平,我们发现这种情况正在开始改变。
在几乎所有类型的输出中(所展示的 31 类输出中有 26 类),Claude Code 上的 AI 自主权水平均高于聊天或 Cowork。11例如,使用 Claude Code 生成脚本和代码片段的对话,其自主权水平比在聊天或 Cowork 上生成相同输出的对话平均高出 0.53 分(基于 1-5 分制)。在所有对话中,自主权水平的平均差异为 0.37 分,这一差异主要来源于两个方面。12
大约三分之二的差异可以归因于在 Claude Code 中,同样的任务以更大幅度的委派方式执行。博客文章和报道文章说明了这一点:两种界面背后的请求和任务相似,但人们与 Claude 协作的方式截然不同。在聊天和 Cowork 对话中,生成一篇博客文章或一篇报道的中位数交互轮次为 13 轮,而在生成博客的 Claude Code session 中,中位数仅包含一次人类提示。剩余三分之一则反映了两种界面在输出类型分布上的不同。

图 2.5:按输出类型划分的 AI 自主性水平按对话输出和界面划分的平均 AI 自主性水平。AI 自主性按 1 至 5 分评分,从“无”到“极高”。
有人可能会猜测这种差异仅仅来自模型选择。Claude Code session 在最强模型上运行的频率要高得多(54% 由 Opus 提供支持,而聊天和 Cowork 对话仅为 10%)。然而,当比较同一模型支持的对话时,差距依然存在。例如,在使用 Sonnet 的对话中,Claude Code session 的自主性仍高出 0.26 个点,这表明所使用的产品可能比底层模型更为关键。
跳出界面比较来看,用户委派最多的输出类型,也正是消耗算力最多的类型:跨产物层面,平均自主性与中位数 token 使用量同步上升(聊天和 Cowork 中 r = 0.68;附录图 A.2)。
Claude 的回答超出了提问的水平
对于每次对话,一个分类器会估算两个阅读水平——一个是用户的提示词,另一个是 Claude 的回答——以理解该文本所需的教育年限来表示。¹³ 我们发现,阅读水平因产物类型而异。生成学术论文的平均查询需要超过 16 年的教育,大致相当于本科水平,其中 15% 的此类对话达到博士水平或以上(20 年或以上教育)。在光谱的另一端是生成食谱或指导的对话,理解其提示词所需的教育年限不到 10 年。
总体而言,阅读水平较高的输出所对应的工件类型,其提示词的阅读水平也较高(跨对话的相关性为0.87)。然而,我们也观察到,在几乎每个类别中,Claude的输出理解难度都高于提示词,平均高出大约一年的教育年限。差距最大的地方在于用户描述需要构建的事物时,例如图像和图形(+2.6年)、游戏(+1.9年)以及应用和网站(+1.7年)。部分差距可能仅仅源于语体差异:提示词通常简短且非正式,而Claude倾向于用润色后的散文风格回复。不过,面向受众的写作(博客-0.1、学术论文+0.0、电子邮件+0.3)差距接近零,这可能是因为这些提示词通常已经包含了与预期输出相同语体的草稿语言或原始材料。

**图2.6:用户提示词与Claude回复的阅读水平,按工件划分**理解用户提示词和Claude回复所需的教育年限估算。仅限聊天和Cowork。
认知
前两章展示了人们如何使用Claude,但并未深入揭示人们在工作中的AI体验——他们如何预期自己的工作与工作场所会发生变化、他们对AI当前和潜在影响的感受,以及他们对这项技术的期望。我们在2025年12月通过Anthropic Interviewer对81,000名Claude用户进行的访谈给出了一幅图景:受访者报告了显著的生产力提升,但也表达了对岗位替代的担忧。这些担忧主要集中在职业生涯早期的工人以及我们观察到Claude承担最多工作的职业群体中。14
2026年4月,我们推出了Anthropic经济指数调查,以进一步推进此项工作。该调查让我们能够直接询问人们关于AI与工作的体验,并探究他们的回答如何随Claude的使用情况而变化。我们采用隐私保护方法,将调查回复与5月中旬至6月初的使用数据进行了关联。为描述每位受访者的使用模式,我们在该时间窗口内对每人随机抽取最多20个会话(涵盖Claude.ai、Cowork和Claude Code,使得会话组合能反映每个人在各平台上的典型使用情况)。我们剔除了会话数少于5个的受访者,以减少抽样噪声。最终关联样本包含约9700名调查受访者。
我们发现,大多数受访者预计未来一年AI将取得显著进展。虽然人们对AI能力的感知取决于其经验、居住地以及工作受AI影响的程度,但他们对于未来进步速度的预期却惊人地一致,这与“水涨船高”的效应相符——即AI能力会在广泛范围内全面提升。
对于这种进步对其自身职业生涯意味着什么,看法则不那么一致。处于职业生涯早期的员工表示,AI能够完成他们工作中最高比例的部分,并且对失业表达了最多的担忧。然而,与一种常见的担忧相反——那些最频繁地将任务委托给Claude的人,对自己未来的劳动力市场前景最为乐观,并认为自己的技能价值在增长。并且,尽管(或许正是因为)他们身处AI前沿附近,受访者对未来十年的平均期望并非被取代,而是协作。他们希望AI能够保留有意义的工作,自动化那些枯燥乏味的任务,并且这些收益能够得到广泛分享。
谁回答了经济指数调查
经济指数调查并不代表总体人口。我们随机抽取了Claude用户样本,但完成调查的用户可能存在选择性偏差,并且我们在分析中过滤掉了不常使用的用户。图3.1显示了调查受访者的职业构成(橙色)与美国就业人口(灰色)的对比。计算机与数学类职业的占比严重偏高,约占受访者的30%——这与他们在Claude使用中的占比相近,但远高于其在美国就业人口中4%的占比。管理层占受访者的23%,15 与其7%的就业人口占比相比也严重偏高,尽管管理层在对话会话中仅占4%。这一差距与管理层将Claude用于非管理类任务的情况相符:在调查中,许多受访者(尤其是有更多经验的受访者)将判断力和管理能力列为AI所缺乏的能力。交通运输与物料搬运、食品制备与餐饮服务、建筑与开采等体力职业类别在调查中占比偏低,在Claude对话会话中的占比也同样偏低。

图3.1:与美国就业人口相比,调查受访者明显集中在计算机与数学以及管理类职业。该图展示了22个主要SOC组别中,受访者报告自身职业的占比,以及各职业在美国就业人口中的对应占比(数据来源:OEWS)。
AI与工作任务
关于AI影响的研究通常关注职业暴露度,即某一职业中可通过AI完成的任务占比。在先前的工作中,我们构建了一个实际暴露度指标,用于衡量我们已观察到被Claude处理的职业任务占比。我们将该指标与一种常用的理论暴露度指标进行了对比,后者衡量的是大语言模型在理论上能够完成的职业任务占比。
理解职业接触程度的另一种方法是直接询问人们,AI 能够完成他们工作中的多大比例。我们请受访者说明,目前 AI 可以完全独立完成他们多少工作任务的占比(以下简称“报告接触度”),以及他们预期在 12 个月后 AI 能处理多大占比(“预期接触度”),选项为从“几乎为零”到“几乎全部”的五个区间。近六成受访者选择了比当前更高一级的明年区间。超过三分之一的受访者预期,明年 AI 能够完成他们大部分或几乎全部的工作任务(图 3.2)。

图 3.2:大多数受访者预期,AI 能完成的工作任务占比在未来 12 个月内将增长。该图展示了受访者表示 AI 当前能完成的工作任务占比与 12 个月后占比的分布情况。
图 3.3 将报告接触度和预期接触度与观察接触度和理论接触度进行了比较。我们考察了受访者报告和预期的 AI 能力是否与各职业的观察接触度和理论接触度测量结果一致,以及那些所在职业在观察接触度或理论接触度上得分较高的受访者,是否预期未来一年会取得更快的进展。关于第一个问题,答案是肯定的:报告接触度(灰点)与观察接触度和理论接触度均呈正相关。关于第二个问题,答案是否定的:报告接触度和 12 个月后预期接触度(橙色点)的最佳拟合线基本平行,这意味着在观察接触度或理论接触度高的岗位上的从业者,与那些在观察接触度和理论接触度较低的岗位上的从业者,预期 AI 在未来一年内能完成的工作任务占比增幅大致相同。¹⁷ 换言之,一位软件工程师和一位施工经理预期各自职业领域的进步幅度大致相当。
同样值得注意的是,报告的使用频率系统地超过了观察到的实际使用情况。对此的一种解释是,并非每个职业中的所有任务都由所有人完成,而我们的调查 disproportionately 地覆盖到了那些更多使用 AI 的人群。¹⁸ 类似地,由于理论暴露度是可能达到的上限,而非当前使用情况的度量,因此理论暴露度系统性地高于报告的使用频率。

图 3.3:报告与预期暴露度对比其他指标 图中展示了人们认为 AI 今天就能完成的任务比例(报告暴露度,灰色)以及 12 个月后的预期比例(预期暴露度,橙色),分别与观察到的实际暴露度(左图)和理论暴露度(右图)进行对比。每个数据点代表一个职业,样本量较小的职业会与暴露度相近的职业合并处理,以保护隐私。报告暴露度和预期暴露度根据调查受访者所选区间的中点计算得出。
我们还考察了受访者对 AI 当前及未来能力的看法与其个人特征及使用模式之间的关联。图 3.4 的左图显示,对 AI 能力的认知与所在国家 GDP 呈负相关:¹⁹ 在高收入国家,人们报告 AI 当前能为其完成的任务平均比例大约低 10 个百分点。这一模式与以下可能性一致:AI 在低收入国家替代了工人日常工作中更大比例的任务——尽管基于职业层面的暴露度指标(该指标在发达经济体中通常更高)给出的结论相反。事实上,国际货币基金组织已指出,尽管发达经济体面临的 AI 总体暴露度更广,但低收入国家的工人可能更缺乏那些让 AI 发挥增强而非替代作用的互补技能和基础设施。在早期研究中,我们记录到即使在调整了任务组合的差异后,低收入经济体在 Claude 使用方式上也倾向于更自动化的模式。
中间面板显示,报告的和预期的暴露程度也与工作年数呈负相关。20 拥有至少 15 年经验的人认为 AI 能够完成的任务比例,比刚入职第一年的人低大约 10 个百分点。我们发现的证据表明,这可能是因为经验丰富的从业者积累了难以被 AI 模仿的隐性知识或特定情境下的专业技能。在后续问题中,我们询问了受访者他们认为 AI 永远无法完成哪些任务及其原因;最常见的回答强调,AI 缺乏其工作所需的判断力、情境感知能力以及情境推理能力。受访者,尤其是拥有至少 15 年经验的人,还指出他们工作中的人际关系层面——建立信任和管理人员——是 AI 无法复制的。
与职业暴露于 AI 的情况类似,我们发现人们对未来 AI 能力提升的看法与人均 GDP 和工作年数基本不相关。受访者认为 12 个月后 AI 能够完成的任务预期比例,普遍高于对当前 AI 能力的看法。

图 3.4:报告的和预期的暴露程度在更高 GDP 国家以及更有经验的从业者中较低,并随着自动化 Claude 使用量的增加而上升。报告的和预期的(12 个月后)暴露程度,对比以下变量:国家人均工作年龄成年人口 GDP(左)、工作年数(中)以及被归类为自动化的 Claude 会话占比(右)。
接下来,我们考察人们与 Claude 互动的方式与其当前对 Claude 能力的看法之间的关系。与之前的报告一致,我们将与 Claude 协作的模式区分为“自动化”和“增强”两种。当 Claude 被要求完成一项任务,而用户几乎不提供输入时,我们将这类对话认定为自动化。具体而言,自动化占比是指对话模式为指令式(如“翻译这份文档”)或反馈循环式(如“编辑这封邮件……让它更随意一些”)的会话所占的比例。21
图 3.4 右侧面板显示,报告的和预期的暴露程度随自动化占比上升而增加。这可能是因为委托任务本身能揭示能力——那些将完整任务交给 AI 的人能直接观察到 AI 能独立完成什么——也可能是因为那些已经相信 AI 能做自己工作的人最愿意把任务交出去。当我们用专用于工作任务的会话占比或 Claude Code 中的会话占比来替代自动化占比时,同样的模式依然成立。22
AI 与就业
我们还询问了人们认为未来 12 个月内自己的工作会发生怎样的变化。超过三分之一的受访者表示,职责很可能会或非常可能发生重大变化(对于自己、同级同事、初级同事和高级同事都是如此)。10% 的受访者认为自己失业的可能性为很可能或非常可能。这略低于美国年化失业风险率;23 然而,由于我们的受访者偏向于处于稳定就业中的知识工作者(这一群体在基准线上面临的离职风险本应低于平均水平),这可能仍表明感知到的风险有所升高。当被问及是什么驱动了他们的预测时(开放式问题),在那些认为自己失业可能性为很可能或非常可能的受访者中,38% 的人将其归因于 AI。24 值得注意的是,受访者总体上对他人的失业担忧程度高于对自己。25 受访者尤其担心初级同事的失业问题,超过三分之一的人认为初级同事在明年内失业的概率超过 60%。受访者对低收入国家(所有人的)失业问题也更为担忧。

图 3.5:报告认为明年工作职责将发生重大变化或有人将非自愿失业的可能性为很可能或非常可能的人群占比。报告认为对于自己、同级同事、初级同事或高级同事,工作职责很可能发生变化(左面板)或个人将失去其想保留的工作(右面板)的受访者占比。
以更自动化方式使用 Claude 的人,是否也更担心失去工作?我们考察了人们关于 AI 在未来一年对工作六个维度预期影响的看法:薪资、工作稳定性、找到新工作的能力(经济维度)以及意义感、自主性和人际互动(内在维度);并观察这些预期如何因 Claude 使用中自动化的占比而有所不同。
在所有六个维度上,与更倾向于增强式使用 Claude 的人相比,自动化会话占比更高的人对 AI 明年对其工作结果的影响持更加乐观的态度。我们观察到,对未来薪资和找到新工作的能力产生积极影响的预期,其效应最为显著。

图 3.6:在更频繁使用自动化方式的 Claude 用户中,报告 AI 对工作质量的经济维度和内在维度具有积极预期影响的人群比例更高。该图显示了以标准化后的 AI 自动化使用占比为自变量,以用户是否预期 AI 对六个工作质量维度中的每一个产生积极影响为因变量,进行线性回归得到的系数估计值。
一个自然而然的问题是,为什么自动化使用程度与积极情绪会同步变化。一种可能解释是,这种关系源于选择性偏差——那些对 AI 最热衷的人,也最愿意将整个任务交给 AI 去处理。我们无法完全排除这种可能性,但当我们在回归模型中控制了用户在 Claude.ai 上的使用时长——这可以视为热忱程度的代理变量,因为它区分了早期采用者和较晚采用者——这些估计值并未发生实质性变化。
另一种可能性是,以更自动化方式使用 AI 的人今天已经更多地体验到了 AI 带来的好处。与我们之前的发现一致,绝大多数用户报告称,AI 在速度、范围和工作质量方面带来了效率提升(比例分别为 86%、82% 和 69%),同时有 27% 的用户报告称,通过节省原本需要购买的服务成本而获得了收益。
除了带来显著的生产力提升外,大多数人还表示使用AI后学习到了更多知识(68%),并且觉得AI让他们的技能变得更有价值(57%)。图3.7展示了这两类结果如何随自动化会话占比而变化。我们可以看到,报告AI提升了自身技能市场价值的人群比例随自动化占比上升而增加,而报告学习到更多知识的人群比例则大致保持稳定。
关于任务委托,一个常见的担忧是,将整个任务交给AI意味着将思考过程外包,产出的增加是以牺牲学习和技能退化为代价的。我们在数据中并未看到这一模式:重度委托者报告的学习效率与其他人群相同。然而,这些是自我评估,即使技能变得更有价值且人们报告学习到了更多知识,技能也可能会退化,因此这些数据并不能排除技能退化的可能性。

图3.7:报告技能预期回报积极的人群比例随自动化占比增加而上升,而报告学习到更多知识的人群比例则保持平稳。此图展示了任务的自动化占比与两类人群比例之间的关系:报告AI提升了自身技能市场价值的人群(蓝色),以及报告使用AI后学习到更多知识的人群(橙色)。
使用方式的性别差异
到目前为止,我们已经探讨了使用模式与期望和行为之间的关系。接下来,我们将研究不同用户以各种方式使用Claude的情况。最显著的差异体现在性别上。在我们的关联受访者样本中仅占12%的女性,使用Claude的方式与男性不同。即使考虑到职业差异,女性在工作中使用Claude的可能性也略低,她们在Claude Code中的会话占比低了0.24个标准差(6.3个百分点),其自动化占比也低了0.33个标准差(7.3个百分点)。相反,女性更倾向于以迭代的方式使用Claude,并且在聊天上的活跃时间比男性更长,这表明她们的参与更具协作性。

图 3.8:女性在使用模式上存在明显差异,即使在考虑了职业差异之后 该图显示了女性与男性相比的使用模式。每个柱状图表示女性与男性在该使用指标上的平均值之差(已控制职业(SOC细分组别)),以结果的标准差表示。须状线表示95%置信区间。样本仅限于自称女性或男性的受访者。女性在Claude Code和自动化使用占比上显著较低,而活跃总分钟数则更高。
人们希望从AI转型的经济中获得什么?
Anthropic经济指数调查揭示了人们对AI的正面与负面体验和感受,但我们在调查结尾留下了一个充满希望的注脚。最后一个开放式问题要求受访者“大胆想象:你希望十年后AI塑造的经济是什么样子?”我们通过一个分类器对每个调查回答进行了处理,标记出回答涉及的相关主题。下面展示了最常被提及的五个主题。每个主题的更多描述见附录。

图 3.9:人们希望实现人机协作、枯燥工作的自动化以及更多空闲时间,并希望AI带来的经济收益能广泛分享 该图显示了受访者对“十年后AI转型的经济是什么样子”这一开放式问题回答中出现的五个最常见主题。
最常见的主题是AI对工作的增强。超过一半的调查受访者表达了某种形式的愿望:希望与AI协作完成有意义的工作、希望自己的职业仍然重要,以及/或者希望新产业涌现并创造新的就业机会。与此同时,略超过半数的受访者希望实现AI自动化——特别是他们工作中乏味的部分——以便拥有更多空闲时间,并在工作之外获得更多意义空间。第三个最常见的主题(约三分之一的受访者提及)是共同繁荣:希望AI带来的经济收益能够得到广泛分享。
讨论
人工智能正迅速在经济领域扩散,覆盖越来越多的应用界面,并生成越来越智能的产出。在早期的AI聊天界面中,使用方式很简单,仅限于聊天窗口内,没有网络搜索、工具调用、工件或其他功能。而现在,Claude模型可以通过Claude Code和Cowork自主运行数小时。随着这些形态的变化,用户群体也在转变。早期采用者多为技术高手,而我们最新的用户则把Claude应用到劳动力市场上薪资较低的工作任务中。
在本报告中,我们采取了多项措施以实现更有信息量的评估。首先,我们开始越来越频繁地进行测量,按小时样本处理数据。这揭示了日常生活节奏如何刻印在我们的使用日志中,并为未来研究开辟了路径。其次,我们开始记录工件,即人们从Claude那里获取的产出。这些工件使Claude的工作输出更加清晰可读,并展现了一些直观的模式。
最后,使用数据所能承载的信息毕竟有限。我们的调查使我们首次能够直接询问人们如何使用AI以及他们对AI的感受。我们发现,受访者使用AI的用途比我们想象的要更广泛——他们报告称,AI在其工作中能完成的份额高于其职业所对应的观测暴露度指标所显示的水平。当被要求预测明年的能力时,超过35%的受访者预测AI将能够完成他们大部分的工作。
准确分类Claude所做的工作将始终是一个动态变化的目标。例如,随着AI能力的提升,AI之间可能会越来越多地交互和交换信息,其方式可能令人类或简单的分类器难以理解。归根结底,Claude对经济的影响将体现在就业和生产率等经济总量指标中,正如其使用日志所反映的那样。尽管如此,AI最早的影响很可能出现在它承担工作最多的领域,因此揭示这些不断变化的使用模式仍将是告知公众的关键方式。
附录
可在此处获取。
引用
@online{anthropic2026aeiv6,
author = {Maxim Massenkoff and Eva Lyubich and Szymon Sacher and Zoe Hitzig and Shaoyi Zhang and Ryan Heller and Peter McCrory},
title = {Anthropic Economic Index report: Cadences},
date = {2026-06-26},
year = {2026},
url = {https://www.anthropic.com/research/economic-index-june-2026-report},
}
复制
作者
Maxim Massenkoff、Eva Lyubich、Szymon Sacher、Zoe Hitzig、Shaoyi Zhang、Ryan Heller、Peter McCrory。
致谢
Scott Booth、Keir Bradwell、Meredith Callan、Dexter Callender III、Boris Cherny、Chris Doenlen、Eleanor Dorfman、Jake Eaton、Evan Frondorf、Deep Ganguli、Romello Goodman、Ankit Gupta、Kunal Handa、Rebecca Hiscott、Andrew Ho、Hanah Ho、Jerry Hong、Saffron Huang、Mo Julapalli、Katie Kennedy、Jennifer Martinez、Miles McCain、Kelsey Nanan、Tyler Neylon、Adnan Pirzada、Dianne Penn、Kerry Persen、Sarah Pollack、Ankur Rathi、Santi Ruiz、David Saunders、Ankit Siva、Michael Stern、Ami Vora、Scott White、Heather Whitney、Kim Withee、Ryan Zauk、Jack Clark。
脚注
- 这包括来自 Claude.ai 和 Claude 桌面端应用上消费者(免费/专业版/最高级)账户的聊天对话和协作会话。“第一方 API”或 1P API 是指通过 Anthropic 自身编程接口直接路由的开发流量,它与 Anthropic 面向消费者的 Claude.ai 应用以及 Amazon Bedrock 或 Google Cloud Vertex 等第三方平台不同。我们继续根据我们的隐私和保留政策管理数据,我们的分析符合我们的条款、政策和合同协议。
- 自始至终,所有分析均基于保护隐私的分类器:对话记录仅由另一个 Claude 实例读取。随后我们过滤掉观察次数不足的单元格,以确保分析的隐私保护性。
- 这包括在 Claude.ai 和 Claude 桌面端应用上聊天和协作选项卡中进行的全部对话。Claude Code 和 API 流量分别呈现。
- “第一方 API”或 1P API 是指通过 Anthropic 自身编程接口直接路由的开发流量,它与 Anthropic 面向消费者的 Claude.ai 应用以及 Amazon Bedrock 或 Google Cloud Vertex 等第三方平台不同。它不包括 Claude Code。
- 参见我们的 Sonnet 3.7 报告和附录。
- 我们将创业活动定义为以下详细请求聚类中对话所占的比例:创业、副业构思、融资、创作者变现、电子商务、商业模式、医疗保健业务、社会企业或活动业务。简历活动则是指神器分类器将输出判定为简历或求职申请的对话。
- 一天中的时段是根据从对话IP地址推断所在时区来确定的。
- 本章数据涵盖了2026年4月10日至6月10日期间采样的聊天(chat)和协作(Cowork)对话。在关于自主性的讨论中进行界面对比时,同样纳入了同一时期的Claude Code会话。工资数据来自美国劳工统计局职业就业和工资统计(BLS OEWS)2025年5月发布版本。
- “无”是一个兜底类别,涵盖那些没有产生明确具体输出的对话。这可能包括简短或中断的交流、导致错误的情况,或者Claude提出澄清性问题后用户没有继续的情况。
- 我们在对话级别的token数量统计中使用了几何平均数,因为该变量呈严重的右偏分布——少数对话使用的token数量比“典型”对话高出几个数量级。如果使用中位数,或者根据所用模型的混合情况按各自成本对token进行加权,结果非常相似。但存在一些显著例外,包括医生相关职业。
- 如需更全面地了解Claude Code,请参阅我们的配套报告。
- 最大的例外是数据和电子表格类别,在此类任务中,聊天(chat)和协作(Cowork)对话的自主性高于Claude Code(3.09 vs 2.74)。这主要是构成差异造成的:约70%的差距源于任务组合的不同。在聊天和协作平台上,这类输出偏向于财务建模和仪表盘,Claude负责设计结构;而在Claude Code上,则偏向于结构化提取和标签标注,规格要求更为精确。协作(Cowork)场景中数据和电子表格工作不仅占比过高且自主性特别强,这部分解释了聊天和协作平台整体得分较高的现象。
- 关于此分类所用提示词的详细信息,请参阅我们三月份报告的附录。
- 在我们的用户群体之外,更结构化的调查数据也呈现出类似模式——这些数据来自 Anthropic 公共记录,这是一项针对超过 5 万名美国人的全国代表性调查。
- 在被归类为管理类职业的人群中,48.1% 的人表示自己在公司任职,24.4% 的人是拥有雇员的老板,21.7% 的人是自雇人士或合同工。其余人目前未就业,报告的是其最近从事的职业。
- 不包括军人。
- 由于回答被分箱处理——因此最低可能的编码回答大于零,最高可能的回答小于一——该图中的斜率存在向零的偏差。因此,我们定性解读斜率的比较,而不将其视为精确估计。然而,这些模式(正斜率且近乎平行线)是稳健的,即便改用“报告 AI 能完成至少 60% 工作任务”这一指标来估计关系,该指标不受中点编码的影响。
- 分箱回答量程可能也有影响:由于中点编码将报告的任务占比拉离极端值,即使不存在任何实质性差异,观察到的暴露度也会倾向于让人觉得在最不易暴露的职业中低估了 AI 的能力,而在最易暴露的职业中高估了它。
- 每名劳动年龄成年人的 GDP 构建方式与 Anthropic 经济指数相同,采用世界银行 WDI(2024)、联合国世界人口展望(2024)中劳动年龄人口估算值,以及国际货币基金组织《世界经济展望》(2025 年估算值)中 GDP 数据。
- 我们询问调查对象在其当前或密切相关的岗位上的工作年限。
- 协作模式分类器将对话记录映射到以下交互模式之一:
指令式:人类将完整任务执行委托给 AI,几乎不需要交互。
反馈循环:人类与 AI 通过迭代对话完成任务,人类主要提供来自环境的反馈。
任务迭代:人类与 AI 通过迭代对话完成任务,人类对 AI 输出进行优化。
学习:人类寻求理解和解释,而非直接完成任务
验证:人类使用AI来检查或验证自己的工作
- 工作份额和Claude Code份额都与自动化正相关:Claude Code是一个智能体工具,其会话平均自动化程度高于聊天或Cowork上的会话,工作会话同样比个人会话更倾向于自动化。工作用途也直接影响——该调查询问的是工作任务,因此使用Claude用于工作的人可能会机械地期望它完成更大份额的工作任务。因此,对这些指标进行条件化处理会削弱自动化份额与任务份额(当前、12个月后以及变化)之间的关系,但这三种关系仍然保持正向且统计显著。
- 美国裁员和解雇率(BLS JOLTS,非农总数,经季节性调整)在截至2026年4月的12个月期间平均约为每月就业人数的1.1%,相当于年化总和约13.4%,因此10%略低于实际发生的非自愿离职事件的年发生率。
- 这个问题是同时针对工作变动预测和工作丢失预测提出的。因此,38%是那些将自己工作丢失预测归因于AI的人群比例的上限。
- 这反映了一个常见的模式:人们对自己状况的评价往往比对他人的评价更有利。在新冠疫情期间也观察到了类似现象,当时自我报告的财务状况优于对国民经济的看法。
- 这与国家GDP和经验形成对比,较低的GDP和经验与较高的任务份额(如图3.4所示)以及较高的自述工作丢失概率相关。
- 虽然这可能是由于chat/Cowork与Claude Code之间的替代效应,但即使在控制了Claude Code会话份额后,该模式依然成立。这些模式在控制职业固定效应后仍然存在。