从 Prompt 到 Harness：AI 工程范式爆炸，下一代开发栈正在重构

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

过去一年，AI 开发领域出现了一个耐人寻味的现象：
围绕大模型的“工程名词”正在快速膨胀——从 prompt engineering、context engineering，到 agent engineering，再到逐渐被提及的 harness engineering。

这并非简单的概念堆叠，而是一个信号：
大模型应用正在从“调用模型”演进为“构建系统”。

导语：为什么 AI 工程突然“分层”了？

在早期，大模型开发几乎等同于写 prompt：

输入一段自然语言
调用 API
返回结果

但随着应用复杂度提升，这种模式迅速失效。开发者开始意识到：

模型只是系统的一部分
输出质量取决于整个上下文与执行链路
可控性与稳定性成为核心挑战

于是，一系列新的“工程分支”开始出现，本质上是在补齐传统软件工程与大模型之间的鸿沟。

Prompt Engineering：从技巧到边缘化

prompt engineering 是最早被广泛讨论的方向，其核心是：

如何通过输入优化模型输出
如何设计指令结构（instruction design）
如何控制风格与行为

但随着模型能力提升，这一层的“技巧红利”正在递减：

更强模型对 prompt 更鲁棒
模板化 prompt 被工具化（prompt libraries）
边际收益下降

这使得 prompt engineering 正在从“核心能力”转变为“基础技能”。

Context Engineering：真正的控制权开始转移

如果说 prompt 是“怎么说”，context engineering 解决的是：

让模型看到什么

这包括：

RAG（检索增强生成）中的文档选择
长上下文拼接策略
memory 注入（长期记忆）
tool schema 与函数定义

在实践中，context 往往比 prompt 更重要，因为：

错误的上下文会直接导致错误推理
信息排序会影响模型注意力分布
上下文长度与成本直接相关

可以说，context engineering 是当前 AI 应用效果的主要决定因素之一。

Agent Engineering：从“生成”走向“执行”

随着 tool calling、function calling 等能力成熟，AI 不再只是生成文本，而是开始执行任务。

agent engineering 关注：

多步任务规划（planning）
工具调用与状态管理
错误恢复与重试机制
多 Agent 协作

这一层的复杂度远高于前两者，因为：

系统变为非确定性流程
状态在多步骤中持续演化
调试难度指数级上升

这也是为什么 Agent 系统常常“不稳定”的根本原因。

Harness Engineering：被忽视但正在崛起的关键层

相比前几个概念，harness engineering 还不算主流，但其重要性正在迅速上升。

所谓 harness，本质是：

围绕模型与 Agent 构建的“测试、评估与运行控制系统”

它解决的问题包括：

如何评估输出质量（evaluation harness）
如何进行回归测试（regression testing）
如何控制实验（A/B testing）
如何管理不同模型版本与配置

在传统软件中，这对应测试框架与 CI/CD；但在 AI 系统中，难度更高，因为：

输出不是确定性的
“正确性”难以定义
评估往往依赖模型本身

因此，harness engineering 正在成为：

AI 工程从“可用”走向“可控”的关键基础设施

本质变化：AI 工程正在形成新技术栈

将这些概念放在一起，可以看到一个逐渐清晰的分层结构：

Prompt：输入表达层
Context：信息供给层
Agent：执行与编排层
Harness：评估与控制层

这与传统软件架构形成一种新的对应关系：

AI 层	类比传统软件
Prompt	UI / 输入
Context	数据层
Agent	业务逻辑
Harness	测试与运维

这意味着，AI 应用开发正在从“调用 API”演变为：

构建一个完整的软件系统，只是核心执行单元变成了模型

为什么会出现“名词爆炸”？

这些新术语的出现，并不是营销驱动，而是工程需求驱动：

复杂度真实存在
AI 系统已经无法用单一抽象描述
传统工具链不适配
单元测试、静态分析等方法难以直接迁移
职责需要明确划分
不同问题需要不同工程手段解决

换句话说，这是一种“被迫分层”。

下一步会出现什么？

如果沿着当前趋势发展，AI 工程还可能继续细分，例如：

Memory Engineering：长期记忆系统设计
Safety Engineering：行为约束与对齐机制
Cost Engineering：推理成本优化与调度

这些方向的共同点是：

围绕模型构建“系统能力”，而不是提升模型本身

结语：从“用模型”到“驯服模型”

prompt、context、agent、harness……这些不断涌现的概念，本质上描述的是同一件事：

模型越来越强
系统越来越复杂
工程越来越重要

对于 AI 技术社区而言，一个重要转变正在发生：

决定产品质量的，不再只是模型能力，而是你如何组织、约束并评估它。

当“写代码”变成“编排智能体”，新的工程范式才刚刚开始成型。

45 次点击 ∙ 0 人收藏

登录后收藏

0 条回复