Claude 开始“分时计价”：一次隐性的算力调度实验

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

Anthropic 正在悄悄把一个电力行业的经典机制，引入到 AI 使用体验中。

2026 年 3 月，这家公司对 Claude 的用量策略进行了结构性调整：不再只是“限额”，而是引入了动态消耗机制（类似峰谷电价）。表面看只是额度变化，实质上，这是一次围绕算力供需的系统级优化。

一、从“限额”到“价格”：AI 开始出现时间维度

新规则的核心很简单：

高峰时段（PT 05:00–11:00）
同样的操作 → 消耗更快
会话额度更容易耗尽
非高峰时段
使用成本相对更低
更适合长任务、重计算

换句话说，Claude 不再是一个“固定成本”的工具，而是一个带时间权重的资源系统。

这和云计算早期的演进路径非常相似：
从按配额 → 到按使用 → 再到按时段调度。

二、谁会真正受到影响？只有 7%，但都是“关键用户”

官方给出的数字是：约 7% 用户会明显感知变化。

但这个 7% 有一个重要特征——他们通常是：

高频开发者（Claude Code / agent workflows）
长上下文用户（大文档 / repo 分析）
自动化任务运行者（batch jobs / scripts）

换句话说，这不是在限制普通用户，而是在调节“算力密集型用户”行为。

这背后的逻辑很清晰：

AI 平台真正的压力，不来自“问问题的人”，而来自“让 AI 连续工作的人”。

三、为什么现在必须这么做？

这一调整，本质上暴露了一个行业现实：

AI 的瓶颈仍然不是模型，而是算力调度。

即便在模型能力持续提升的同时，以下问题依然存在：

GPU 资源分布不均（时间/地域）
Agent 使用模式不可预测（突发高负载）
长上下文任务吞噬资源（token 爆炸）

相比“一刀切限流”，Anthropic 选择了一条更精细的路径：

👉 用“经济机制”引导用户行为，而不是强制限制

这比传统方案更“温和”，但也更深远。

四、对开发者意味着什么：AI 使用进入“调度时代”

如果你在用 Claude 做开发或自动化，这次变化其实是在传递一个信号：

1. 任务需要“分层”

实时交互（chat / debug） → 放高峰也没问题
批处理任务（refactor / analyze） → 应该错峰

2. Agent 工作流要“时间感知”

未来的 AI Agent，很可能需要具备：

自动判断当前负载成本
延迟执行非关键任务
动态拆分任务规模

这其实已经接近一个调度系统（scheduler）的设计问题。

五、从 Claude 到整个行业：一个更大的趋势

Anthropic 的这次调整，不是孤立事件，而是一个行业信号：

AI 正在从“无限工具”变成“有限资源”

过去的叙事是：

AI 是随取随用的智能

现在开始变成：

AI 是需要调度的算力资源

这意味着：

使用策略 ≈ 编程能力的一部分
效率优化 ≈ 成本优化
时间选择 ≈ 性能优化

六、一个更长远的判断：AI 的“电力化”

如果把这次变化放到更长周期看，它很可能是 AI 基础设施演进的早期形态：

阶段	特征
初期	固定额度（today）
中期	分时计价（现在开始）
后期	实时竞价（类似云 spot 实例）

最终，AI 可能会变成类似电力或云计算的基础设施：

有峰值
有成本曲线
有调度策略

而用户——尤其是开发者——需要学会的，不只是“怎么用 AI”，而是：

什么时候用、用多少、怎么用最划算

结语

这次看似“悄悄”的额度调整，其实是一次非常典型的基础设施信号：

模型能力的竞争，正在让位于“算力调度能力”的竞争。

而 Claude 的这一步，很可能只是开始。

58 次点击 ∙ 0 人收藏

登录后收藏

0 条回复