过去一年,AI 开发领域出现了一个耐人寻味的现象:
围绕大模型的“工程名词”正在快速膨胀——从 prompt engineering、context engineering,到 agent engineering,再到逐渐被提及的 harness engineering。
这并非简单的概念堆叠,而是一个信号:
大模型应用正在从“调用模型”演进为“构建系统”。
在早期,大模型开发几乎等同于写 prompt:
但随着应用复杂度提升,这种模式迅速失效。开发者开始意识到:
于是,一系列新的“工程分支”开始出现,本质上是在补齐传统软件工程与大模型之间的鸿沟。
prompt engineering 是最早被广泛讨论的方向,其核心是:
但随着模型能力提升,这一层的“技巧红利”正在递减:
这使得 prompt engineering 正在从“核心能力”转变为“基础技能”。
如果说 prompt 是“怎么说”,context engineering 解决的是:
让模型看到什么
这包括:
在实践中,context 往往比 prompt 更重要,因为:
可以说,context engineering 是当前 AI 应用效果的主要决定因素之一。
随着 tool calling、function calling 等能力成熟,AI 不再只是生成文本,而是开始执行任务。
agent engineering 关注:
这一层的复杂度远高于前两者,因为:
这也是为什么 Agent 系统常常“不稳定”的根本原因。
相比前几个概念,harness engineering 还不算主流,但其重要性正在迅速上升。
所谓 harness,本质是:
围绕模型与 Agent 构建的“测试、评估与运行控制系统”
它解决的问题包括:
在传统软件中,这对应测试框架与 CI/CD;但在 AI 系统中,难度更高,因为:
因此,harness engineering 正在成为:
AI 工程从“可用”走向“可控”的关键基础设施
将这些概念放在一起,可以看到一个逐渐清晰的分层结构:
这与传统软件架构形成一种新的对应关系:
| AI 层 | 类比传统软件 |
|---|---|
| Prompt | UI / 输入 |
| Context | 数据层 |
| Agent | 业务逻辑 |
| Harness | 测试与运维 |
这意味着,AI 应用开发正在从“调用 API”演变为:
构建一个完整的软件系统,只是核心执行单元变成了模型
这些新术语的出现,并不是营销驱动,而是工程需求驱动:
复杂度真实存在
AI 系统已经无法用单一抽象描述
传统工具链不适配
单元测试、静态分析等方法难以直接迁移
职责需要明确划分
不同问题需要不同工程手段解决
换句话说,这是一种“被迫分层”。
如果沿着当前趋势发展,AI 工程还可能继续细分,例如:
这些方向的共同点是:
围绕模型构建“系统能力”,而不是提升模型本身
prompt、context、agent、harness……这些不断涌现的概念,本质上描述的是同一件事:
对于 AI 技术社区而言,一个重要转变正在发生:
决定产品质量的,不再只是模型能力,而是你如何组织、约束并评估它。
当“写代码”变成“编排智能体”,新的工程范式才刚刚开始成型。