Anthropic 发文： AI 对劳动力市场的影响：一种新度量方法与早期证据

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

链接 https://www.anthropic.com/research/labor-market-impacts

关键发现（Key findings）

我们提出了一种新的 AI 替代风险度量——“观测暴露”（observed exposure），该指标结合了理论上的大语言模型（LLM）能力与真实世界使用数据，并对自动化（而非辅助）以及工作场景中的使用赋予更高权重
AI 距离其理论能力仍有明显差距：实际覆盖范围仅是潜在能力的一小部分
在美国劳工统计局（BLS）的预测中，观测暴露更高的职业，到 2034 年的增长更慢
暴露程度最高的职业，其从业者更可能是年长、女性、受教育程度更高、收入更高
自 2022 年末以来，尚未观察到高暴露群体失业率系统性上升；但有迹象表明，相关职业中年轻人的招聘正在放缓

引言（Introduction）

AI 的快速扩散正推动一波关于其对劳动力市场影响的研究浪潮。但过往方法的表现提醒我们应保持谨慎。

例如，一项有影响力的研究曾认为约四分之一的美国岗位易于外包，但十年后，这些岗位大多数仍保持良好的就业增长。政府的职业增长预测虽然方向上正确，但相比简单的历史趋势外推，并未显著提升预测能力。即便事后回顾，大规模经济冲击对劳动力市场的影响也往往难以明确识别。关于工业机器人对就业的影响，研究结论相互矛盾；“中国冲击”导致的就业损失规模也仍存在争议。¹

本文提出一种新的分析框架来理解 AI 对劳动力市场的影响，并用早期数据进行检验。结果显示，目前 AI 对就业的影响证据仍然有限。我们的目标是建立一套测量方法，并定期更新分析。

该方法无法覆盖 AI 影响劳动力市场的所有路径，但通过在显著影响出现之前建立框架，我们希望未来能够更可靠地识别经济冲击，而不是事后归因。

AI 的影响可能会变得非常明显，但该框架在影响尚不明确时更具价值——可以帮助提前识别最脆弱的岗位。

反事实（Counterfactuals）

当影响巨大且突然时，因果推断更容易。例如新冠疫情带来的冲击非常显著，使得复杂统计方法在很多问题上变得不必要。

但 AI 的影响可能更像互联网或中美贸易，而非疫情：

不会立即体现在整体失业率上
会被贸易政策、商业周期等因素掩盖

常见方法是比较不同 AI 暴露程度的群体，以隔离 AI 的影响。²
暴露通常按任务定义，例如：

AI 可以批改作业，但无法管理课堂 → 教师暴露较低
完全可远程完成的岗位 → 暴露更高

本文采用任务级方法，结合：

理论能力
实际使用
并最终汇总到职业层面。³

暴露的测量（Measuring exposure）

我们结合三类数据：

O*NET 数据库：涵盖约 800 个美国职业的任务
Anthropic 使用数据（经济指数）
Eloundou 等（2023）任务暴露指标

Eloundou 指标 β 定义为：

β = 1：LLM 可将任务效率提升 2 倍
β = 0.5：需结合其他工具
β = 0：不可实现⁴

为什么实际使用低于理论能力？

原因包括：

模型能力限制
法律约束
软件依赖
人工审核流程

例如：
“批准药物续方并向药房提供处方信息”被标记为 β=1，但我们尚未观察到 Claude 执行该任务，尽管理论上可行。

不过，两者仍高度相关：
97% 的实际任务都属于理论可行范围（β≥0.5）

图 1：Claude 使用与任务暴露等级的关系

说明：
Claude 使用分布在不同 O*NET 任务中：

β=1（完全可行）：占 68%
β=0（不可行）：仅 3%

数据来源：前四期经济指数报告

新指标：职业“观测暴露”（A new measure）

该指标衡量：

在理论上可被 LLM 加速的任务中，有多少在现实中已经被自动化使用？

如果一个职业满足以下条件，其暴露更高：

任务理论上可由 AI 完成
在数据中有明显使用
属于工作场景
自动化使用比例更高（而非辅助）
AI 涉及任务占比更高

计算方法

将理论可行任务标记为“覆盖”
自动化使用权重 = 1，辅助使用权重 = 0.5
按任务时间占比加权
汇总到职业层面

图 2：理论能力 vs 实际暴露

蓝色：理论能力
红色：实际使用

示例：

计算机与数学类职业：理论可覆盖 94%
实际仅覆盖 33%

说明：
AI 仍远未达到其潜在能力

图 3：暴露最高的职业

前十职业包括：

计算机程序员（75%）
客服代表
数据录入员（67%）

底部约 30% 职业为零暴露，例如：

厨师
摩托车技师
救生员
酒吧服务员

暴露与就业增长、人口特征（Figure 4 & 5）

图 4：暴露 vs 就业增长预测

结论：

暴露每提高 10 个百分点
未来就业增长下降 0.6 个百分点

（相关性较弱，但方向一致）

图 5：高暴露 vs 低暴露群体差异

高暴露群体：

女性比例 +16%
白人比例 +11%
亚裔比例显著更高
收入高 47%
教育程度更高

例如：

研究生：未暴露 4.5% vs 高暴露 17.4%

重点指标：失业率（Prioritizing outcomes）

我们选择失业率作为核心指标，因为：

最直接反映经济伤害
招聘减少 ≠ 就业减少

AI 的负面影响通常应表现为：

被替代 → 搜索新工作 → 失业上升

初步结果（Initial results）

图 6：失业率趋势

结论：

疫情期间：低暴露群体失业上升更多
此后：两组趋势基本一致
ChatGPT 发布后：
高暴露群体失业率变化不显著

可检测影响范围

约 1 个百分点失业变化可被检测
极端情况（10%岗位全部消失）：
失业率 3% → 43%
总体失业率 4% → 13%

“白领大衰退”情景

若类似 2008：

失业率翻倍（3% → 6%）
本框架可检测到

年轻人影响（Figure 7）

重点观察 22–25 岁群体：

失业率：无明显变化
但招聘下降

图 7 发现：

高暴露岗位入职率下降约 0.5 个百分点
相对降幅约 14%（边际显著）

可能解释：

留在原岗位
转岗
继续深造

讨论（Discussion）

本文提出：

一种结合“理论能力 + 实际使用”的 AI 劳动力影响测量框架

主要结论：

高暴露职业：程序员、客服、金融分析师
尚未发现失业上升
但年轻人招聘出现放缓迹象

该框架可持续更新，有助于未来识别真正的结构性变化。

局限与未来工作

使用数据需持续更新
理论指标需跟随模型能力演进
需重点研究：
应届毕业生如何进入高暴露行业

附录（Appendix）

见原文链接

致谢（Acknowledgements）

作者：
Maxim Massenkoff, Peter McCrory

（其余人员名单略，保持原文）

引用（Citation）

@online{massenkoffmccrory2026labor,
 author = {Maxim Massenkoff and Peter McCrory},
 title = {Labor market impacts of AI: A new measure and early evidence},
 date = {2026-03-05},
 year = {2026},
 url = {https://www.anthropic.com/research/labor-market-impacts},
}

参考文献（References）

（保持原文列出，不翻译论文标题，仅整理格式）

Acemoglu & Restrepo (2020)
Acemoglu et al. (2022)
Appel et al. (2026)
Autor et al. (2013)
Autor & Thompson (2025)
Blinder et al. (2009)
Borusyak et al. (2022)
Brynjolfsson et al. (2025)
Eloundou et al. (2023)
等（完整列表保留）

脚注（Footnotes）

外包、机器人、中国冲击相关研究
不同研究的暴露测量方法
方法可扩展至其他国家
β 指标定义
使用数据来源：2025 年 8 月与 11 月
指标构建存在主观选择，但结果稳健
CPS 数据匹配方法
不同模型扩展结果一致
年轻人就业下降来自招聘减少
数据误差可能影响结果

修订说明（Corrections）

2026 年 3 月 8 日更新：修正图 7 标签错误

93 次点击 ∙ 0 人收藏

登录后收藏

0 条回复