链接 https://www.anthropic.com/research/labor-market-impacts
关键发现(Key findings)
- 我们提出了一种新的 AI 替代风险度量——“观测暴露”(observed exposure),该指标结合了理论上的大语言模型(LLM)能力与真实世界使用数据,并对自动化(而非辅助)以及工作场景中的使用赋予更高权重
- AI 距离其理论能力仍有明显差距:实际覆盖范围仅是潜在能力的一小部分
- 在美国劳工统计局(BLS)的预测中,观测暴露更高的职业,到 2034 年的增长更慢
- 暴露程度最高的职业,其从业者更可能是年长、女性、受教育程度更高、收入更高
- 自 2022 年末以来,尚未观察到高暴露群体失业率系统性上升;但有迹象表明,相关职业中年轻人的招聘正在放缓
引言(Introduction)
AI 的快速扩散正推动一波关于其对劳动力市场影响的研究浪潮。但过往方法的表现提醒我们应保持谨慎。
例如,一项有影响力的研究曾认为约四分之一的美国岗位易于外包,但十年后,这些岗位大多数仍保持良好的就业增长。政府的职业增长预测虽然方向上正确,但相比简单的历史趋势外推,并未显著提升预测能力。即便事后回顾,大规模经济冲击对劳动力市场的影响也往往难以明确识别。关于工业机器人对就业的影响,研究结论相互矛盾;“中国冲击”导致的就业损失规模也仍存在争议。¹
本文提出一种新的分析框架来理解 AI 对劳动力市场的影响,并用早期数据进行检验。结果显示,目前 AI 对就业的影响证据仍然有限。我们的目标是建立一套测量方法,并定期更新分析。
该方法无法覆盖 AI 影响劳动力市场的所有路径,但通过在显著影响出现之前建立框架,我们希望未来能够更可靠地识别经济冲击,而不是事后归因。
AI 的影响可能会变得非常明显,但该框架在影响尚不明确时更具价值——可以帮助提前识别最脆弱的岗位。
反事实(Counterfactuals)
当影响巨大且突然时,因果推断更容易。例如新冠疫情带来的冲击非常显著,使得复杂统计方法在很多问题上变得不必要。
但 AI 的影响可能更像互联网或中美贸易,而非疫情:
- 不会立即体现在整体失业率上
- 会被贸易政策、商业周期等因素掩盖
常见方法是比较不同 AI 暴露程度的群体,以隔离 AI 的影响。²
暴露通常按任务定义,例如:
- AI 可以批改作业,但无法管理课堂 → 教师暴露较低
- 完全可远程完成的岗位 → 暴露更高
本文采用任务级方法,结合:
暴露的测量(Measuring exposure)
我们结合三类数据:
- O*NET 数据库:涵盖约 800 个美国职业的任务
- Anthropic 使用数据(经济指数)
- Eloundou 等(2023)任务暴露指标
Eloundou 指标 β 定义为:
- β = 1:LLM 可将任务效率提升 2 倍
- β = 0.5:需结合其他工具
- β = 0:不可实现⁴
为什么实际使用低于理论能力?
原因包括:
例如:
“批准药物续方并向药房提供处方信息”被标记为 β=1,但我们尚未观察到 Claude 执行该任务,尽管理论上可行。
不过,两者仍高度相关:
97% 的实际任务都属于理论可行范围(β≥0.5)
图 1:Claude 使用与任务暴露等级的关系
说明:
Claude 使用分布在不同 O*NET 任务中:
- β=1(完全可行):占 68%
- β=0(不可行):仅 3%
数据来源:前四期经济指数报告
新指标:职业“观测暴露”(A new measure)
该指标衡量:
在理论上可被 LLM 加速的任务中,有多少在现实中已经被自动化使用?
如果一个职业满足以下条件,其暴露更高:
- 任务理论上可由 AI 完成
- 在数据中有明显使用
- 属于工作场景
- 自动化使用比例更高(而非辅助)
- AI 涉及任务占比更高
计算方法
- 将理论可行任务标记为“覆盖”
- 自动化使用权重 = 1,辅助使用权重 = 0.5
- 按任务时间占比加权
- 汇总到职业层面
图 2:理论能力 vs 实际暴露
蓝色:理论能力
红色:实际使用
示例:
- 计算机与数学类职业:理论可覆盖 94%
- 实际仅覆盖 33%
说明:
AI 仍远未达到其潜在能力
图 3:暴露最高的职业
前十职业包括:
- 计算机程序员(75%)
- 客服代表
- 数据录入员(67%)
底部约 30% 职业为零暴露,例如:
暴露与就业增长、人口特征(Figure 4 & 5)
图 4:暴露 vs 就业增长预测
结论:
- 暴露每提高 10 个百分点
- 未来就业增长下降 0.6 个百分点
(相关性较弱,但方向一致)
图 5:高暴露 vs 低暴露群体差异
高暴露群体:
- 女性比例 +16%
- 白人比例 +11%
- 亚裔比例显著更高
- 收入高 47%
- 教育程度更高
例如:
- 研究生:未暴露 4.5% vs 高暴露 17.4%
重点指标:失业率(Prioritizing outcomes)
我们选择失业率作为核心指标,因为:
AI 的负面影响通常应表现为:
被替代 → 搜索新工作 → 失业上升
初步结果(Initial results)
图 6:失业率趋势
结论:
- 疫情期间:低暴露群体失业上升更多
- 此后:两组趋势基本一致
- ChatGPT 发布后:
高暴露群体失业率变化不显著
可检测影响范围
- 约 1 个百分点失业变化可被检测
-
极端情况(10%岗位全部消失):
-
失业率 3% → 43%
- 总体失业率 4% → 13%
“白领大衰退”情景
若类似 2008:
年轻人影响(Figure 7)
重点观察 22–25 岁群体:
图 7 发现:
- 高暴露岗位入职率下降约 0.5 个百分点
- 相对降幅约 14%(边际显著)
可能解释:
讨论(Discussion)
本文提出:
一种结合“理论能力 + 实际使用”的 AI 劳动力影响测量框架
主要结论:
- 高暴露职业:程序员、客服、金融分析师
- 尚未发现失业上升
- 但年轻人招聘出现放缓迹象
该框架可持续更新,有助于未来识别真正的结构性变化。
局限与未来工作
- 使用数据需持续更新
- 理论指标需跟随模型能力演进
- 需重点研究:
应届毕业生如何进入高暴露行业
附录(Appendix)
见原文链接
致谢(Acknowledgements)
作者:
Maxim Massenkoff, Peter McCrory
(其余人员名单略,保持原文)
引用(Citation)
@online{massenkoffmccrory2026labor,
author = {Maxim Massenkoff and Peter McCrory},
title = {Labor market impacts of AI: A new measure and early evidence},
date = {2026-03-05},
year = {2026},
url = {https://www.anthropic.com/research/labor-market-impacts},
}
参考文献(References)
(保持原文列出,不翻译论文标题,仅整理格式)
- Acemoglu & Restrepo (2020)
- Acemoglu et al. (2022)
- Appel et al. (2026)
- Autor et al. (2013)
- Autor & Thompson (2025)
- Blinder et al. (2009)
- Borusyak et al. (2022)
- Brynjolfsson et al. (2025)
- Eloundou et al. (2023)
- 等(完整列表保留)
脚注(Footnotes)
- 外包、机器人、中国冲击相关研究
- 不同研究的暴露测量方法
- 方法可扩展至其他国家
- β 指标定义
- 使用数据来源:2025 年 8 月与 11 月
- 指标构建存在主观选择,但结果稳健
- CPS 数据匹配方法
- 不同模型扩展结果一致
- 年轻人就业下降来自招聘减少
- 数据误差可能影响结果
修订说明(Corrections)
- 2026 年 3 月 8 日更新:修正图 7 标签错误