Chrome 引入 AI Skills：从 Prompt 到“可复用 Agent”，浏览器正在进化为轻量工作流引擎

OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

当大模型逐渐成为日常工具，一个被长期忽视的问题开始浮出水面：Prompt 本身是否可以被产品化？

正在给出自己的答案。随着新增 “Skills” 功能，以及在浏览器中的深度集成，用户可以将常用提示词（prompt）保存为可复用能力，并在不同网页间一键调用。

这看似是一个小功能升级，但从 AI 工程视角来看，它标志着浏览器角色的变化：从信息展示容器，转向承载 Agent 执行的轻量运行时环境。

从 Prompt 到 Skill：一次“抽象层级”的提升

在当前大模型使用模式中，Prompt 仍然是最基础的交互单元。但其问题也很明显：

难以复用：用户需要重复输入或复制粘贴
缺乏结构：prompt 往往是非结构化文本
无上下文绑定：无法自动适配不同页面内容

Chrome 的 Skills，本质上是将 Prompt 提升为“可执行模板”，具备以下特征：

持久化存储：用户可保存常用提示
跨页面复用：在任意网页环境调用
与上下文绑定：自动作用于当前页面内容

例如，在食谱网站中定义“将配方转换为素食版本”的 Skill，之后可在任意菜谱页面直接复用，而无需重新构造 prompt。

这一步，相当于把 Prompt 从“输入”变成了“工具”。

技术底层：浏览器内的轻量 Agent Runtime

从实现角度看，Skills 并非简单的文本保存，更接近一个浏览器内的 Agent 执行框架，其核心可能包括：

1. 上下文感知（Context Injection）

Skill 执行时，需要自动获取当前页面内容，例如：

DOM 结构解析
页面文本抽取
用户选区（selection）

并将这些信息注入到 prompt 中，形成动态输入。

2. Prompt 模板化（Prompt Templating）

Skill 很可能以模板形式存在，例如：

固定指令 + 可变上下文
参数化输入（如 {content}、{title}）

类似于一个轻量级的 function calling 机制。

3. 模型调用与结果渲染

通过内置的能力，浏览器可以：

调用模型进行推理
将结果嵌入页面（如侧边栏、浮层）
支持进一步交互或编辑

这使得浏览器本身具备了“执行 AI 任务”的能力，而不仅是展示结果。

与传统插件的差异：从扩展逻辑到语言驱动

Chrome 过去的扩展（Extension）体系，本质上是代码驱动：

需要开发者编写 JavaScript
通过 API 操作页面与数据
部署与分发成本较高

而 Skills 引入了一种新的范式：语言驱动（language-driven tooling）。

对比来看：

Extension：代码定义逻辑
Skill：自然语言定义行为

这意味着：

普通用户也可以构建“自动化工具”
AI 成为执行逻辑的核心引擎
浏览器成为 Prompt 的运行环境

从开发者视角，这是一种“低代码 Agent 平台”的雏形。

行业背景：浏览器成为 AI 入口的必然演化

Chrome 的这一变化，并非孤立事件，而是浏览器角色演进的一部分。

当前几大趋势正在叠加：

AI 助手逐步内嵌操作系统与应用
用户行为从“搜索”转向“指令驱动”
Web 页面成为结构化数据与非结构化内容的混合体

在这一背景下，浏览器天然具备三大优势：

上下文入口：直接接触用户当前任务环境
跨站点能力：可在不同网站间执行统一逻辑
交互界面：无需额外应用即可呈现结果

因此，将 AI Agent 能力嵌入浏览器，是一个高频、高粘性的落点。

对开发者的意义：Prompt Engineering 正在产品化

Skills 的推出，对 AI 技术社区释放出一个明确信号：

Prompt Engineering 正在从“技巧”演变为“产品能力”。

这将带来几个变化：

1. Prompt 的资产化

高质量 prompt 可以被保存、分享、复用
Prompt 可能形成类似“插件市场”的生态

2. Agent 颗粒度变小

不再是复杂多步骤 Agent
而是大量“单功能 Skill”组合

类似 Unix 工具链：每个工具只做一件事，但可以组合。

3. AI 工作流前移到用户侧

用户可以在浏览器中直接构建自动化流程
不再完全依赖 SaaS 或后端服务

这将改变 AI 应用的分发路径。

挑战与限制：从“好用”到“可靠”仍有距离

尽管 Skills 提供了新的交互范式，但仍面临一些工程挑战：

结果一致性问题：同一 Skill 在不同页面表现可能不稳定
上下文污染：网页内容复杂，可能影响模型判断
可解释性不足：用户难以理解 Skill 的具体执行逻辑

此外，安全与隐私也是关键问题：

Skill 是否会读取敏感页面信息？
Prompt 是否可能泄露用户数据？

这些都需要浏览器层面的权限与隔离机制支持。

结语：浏览器正在成为“最轻量的 AI 操作系统”

从引入，到推出 Skills，正在将 Chrome 从“浏览工具”升级为“AI 执行环境”。

这背后是一种更深层的趋势：AI 不再只是一个应用，而是嵌入所有应用的执行层。

当 Prompt 可以被保存、复用、点击执行，用户实际上已经在无意识中使用 Agent。而浏览器，则成为这些 Agent 最自然的运行场所。

对于开发者而言，这意味着一个新的构建空间正在出现——不是构建应用，而是构建“能力单元”。

20 次点击 ∙ 0 人收藏

登录后收藏

0 条回复