在传统软件交付体系中,CI/CD 的核心是“自动化执行”。
但在生成式 AI 时代,这个范式正在被彻底改写:
交付系统不再执行指令,而是理解意图、做出决策,并持续学习。
这就是 AI Harness Engineering 的本质。
我们先给出一个更清晰的三阶段模型:
| 阶段 | 核心能力 | 系统角色 |
|---|---|---|
| CI/CD | 自动执行 | 工具 |
| Harness | 控制闭环 | 系统 |
| AI Harness | 自主决策 | 智能体 |
👉 关键变化:
Pipeline (执行逻辑)
→ Control Loop(反馈系统)
→ Agent(自主决策系统)
传统 Pipeline:
build → test → deploy
AI Harness 中:
intent:
goal: "deploy checkout service"
constraints:
- availability >= 99.99%
- cost <= $500/day
- region: asia-east
👉 核心变化:
从“怎么做(How)” → “想要什么(What)”
AI 系统会自动生成:
这本质上是一个:
Planning Problem(规划问题)
类似于 AI Agent 的任务分解:
Goal → Subtasks → Execution Graph
在 AI Harness 中:
Pipeline 不再是静态定义,而是:
DAG = f(intent, environment, history)
影响因素:
👉 结果:
每一次部署的 pipeline 都可能不同
传统监控系统(如 Prometheus)只提供数据。
AI Harness 做的是:
把“指标”变成“判断”
传统:
error_rate > 5% → alert
AI 模型:
P(anomaly | metrics) > 0.92 → rollback
技术实现:
结合日志平台(如 Splunk):
AI 可以自动输出:
Deployment failed because:
- DB connection pool exhausted
- Caused by increased concurrency in v2
👉 这一步极其关键:
从“发现问题” → “解释问题”
结合 Open Policy Agent:
if anomaly_score > threshold:
enforce rollback
进一步升级为:
if risk_score > acceptable_range:
block rollout progression
👉 这里出现一个新概念:
Risk-aware Deployment
传统 Harness:
Observe → Compare → Act
AI Harness:
Observe → Interpret → Decide → Act → Learn
系统会记录:
{
"service": "checkout",
"change": "increase concurrency",
"result": "failed",
"reason": "DB overload"
}
👉 下一次部署:
AI 会:
系统开始“积累经验”
未来 Harness Engineering 的核心形态不是工具,而是:
Delivery Agent
工程师:
把支付服务发布到东京区,保持低风险
系统(Agent):
计划如下:
- 使用 canary(10% → 30% → 100%)
- 监控 latency / error_rate
- 设置自动 rollback
预计成本:+$120/day
是否执行?
👉 关键变化:
交付系统开始“对话”
未来系统可能由多个 Agent 组成:
| Agent | 职责 |
|---|---|
| Planner | 生成 deployment plan |
| Verifier | 判断系统健康 |
| Optimizer | 调整 rollout |
| FinOps Agent | 控制成本 |
AI Harness 最终会成为 IDP 的核心:
👉 但变化是:
平台不再是“工具集合”,而是“智能接口”
开发者不再写:
而是:
Deploy service with low latency in Asia
系统自动完成:
这一部分可以让文章更“硬核”。
问题:
AI 为什么 rollback?
必须输出:
因为 p99 latency 上升 23%,超过历史区间
👉 本质是:
一个风险函数优化问题
新服务没有历史数据:
解决方案:
Harness Engineering 的终局,不是更强的 CI/CD,而是:
一个能够理解系统状态、预测风险、并自主做出部署决策的智能体系统。
如果说:
软件交付的认知模型(Cognitive Model of Delivery)
最终的软件交付系统,将不再是工具链,而是:
一个持续学习、持续优化的软件生产智能体。