OA0
OA0 是一个探索 AI 的社区
现在注册
已注册用户请  登录
OA0  ›  社区  ›  Google

Chrome 引入 AI Skills:从 Prompt 到“可复用 Agent”,浏览器正在进化为轻量工作流引擎

 
  beat ·  2026-04-15 14:15:59 · 20 次点击  · 0 条评论  

当大模型逐渐成为日常工具,一个被长期忽视的问题开始浮出水面:Prompt 本身是否可以被产品化?

正在给出自己的答案。随着 新增 “Skills” 功能,以及 在浏览器中的深度集成,用户可以将常用提示词(prompt)保存为可复用能力,并在不同网页间一键调用。

这看似是一个小功能升级,但从 AI 工程视角来看,它标志着浏览器角色的变化:从信息展示容器,转向承载 Agent 执行的轻量运行时环境。

从 Prompt 到 Skill:一次“抽象层级”的提升

在当前大模型使用模式中,Prompt 仍然是最基础的交互单元。但其问题也很明显:

  • 难以复用:用户需要重复输入或复制粘贴
  • 缺乏结构:prompt 往往是非结构化文本
  • 无上下文绑定:无法自动适配不同页面内容

Chrome 的 Skills,本质上是将 Prompt 提升为“可执行模板”,具备以下特征:

  • 持久化存储:用户可保存常用提示
  • 跨页面复用:在任意网页环境调用
  • 与上下文绑定:自动作用于当前页面内容

例如,在食谱网站中定义“将配方转换为素食版本”的 Skill,之后可在任意菜谱页面直接复用,而无需重新构造 prompt。

这一步,相当于把 Prompt 从“输入”变成了“工具”。

技术底层:浏览器内的轻量 Agent Runtime

从实现角度看,Skills 并非简单的文本保存,更接近一个浏览器内的 Agent 执行框架,其核心可能包括:

1. 上下文感知(Context Injection)

Skill 执行时,需要自动获取当前页面内容,例如:

  • DOM 结构解析
  • 页面文本抽取
  • 用户选区(selection)

并将这些信息注入到 prompt 中,形成动态输入。

2. Prompt 模板化(Prompt Templating)

Skill 很可能以模板形式存在,例如:

  • 固定指令 + 可变上下文
  • 参数化输入(如 {content}{title}

类似于一个轻量级的 function calling 机制。

3. 模型调用与结果渲染

通过内置的 能力,浏览器可以:

  • 调用模型进行推理
  • 将结果嵌入页面(如侧边栏、浮层)
  • 支持进一步交互或编辑

这使得浏览器本身具备了“执行 AI 任务”的能力,而不仅是展示结果。

与传统插件的差异:从扩展逻辑到语言驱动

Chrome 过去的扩展(Extension)体系,本质上是代码驱动:

  • 需要开发者编写 JavaScript
  • 通过 API 操作页面与数据
  • 部署与分发成本较高

而 Skills 引入了一种新的范式:语言驱动(language-driven tooling)

对比来看:

  • Extension:代码定义逻辑
  • Skill:自然语言定义行为

这意味着:

  • 普通用户也可以构建“自动化工具”
  • AI 成为执行逻辑的核心引擎
  • 浏览器成为 Prompt 的运行环境

从开发者视角,这是一种“低代码 Agent 平台”的雏形。

行业背景:浏览器成为 AI 入口的必然演化

Chrome 的这一变化,并非孤立事件,而是浏览器角色演进的一部分。

当前几大趋势正在叠加:

  • AI 助手逐步内嵌操作系统与应用
  • 用户行为从“搜索”转向“指令驱动”
  • Web 页面成为结构化数据与非结构化内容的混合体

在这一背景下,浏览器天然具备三大优势:

  • 上下文入口:直接接触用户当前任务环境
  • 跨站点能力:可在不同网站间执行统一逻辑
  • 交互界面:无需额外应用即可呈现结果

因此,将 AI Agent 能力嵌入浏览器,是一个高频、高粘性的落点。

对开发者的意义:Prompt Engineering 正在产品化

Skills 的推出,对 AI 技术社区释放出一个明确信号:

Prompt Engineering 正在从“技巧”演变为“产品能力”。

这将带来几个变化:

1. Prompt 的资产化

  • 高质量 prompt 可以被保存、分享、复用
  • Prompt 可能形成类似“插件市场”的生态

2. Agent 颗粒度变小

  • 不再是复杂多步骤 Agent
  • 而是大量“单功能 Skill”组合

类似 Unix 工具链:每个工具只做一件事,但可以组合。

3. AI 工作流前移到用户侧

  • 用户可以在浏览器中直接构建自动化流程
  • 不再完全依赖 SaaS 或后端服务

这将改变 AI 应用的分发路径。

挑战与限制:从“好用”到“可靠”仍有距离

尽管 Skills 提供了新的交互范式,但仍面临一些工程挑战:

  • 结果一致性问题:同一 Skill 在不同页面表现可能不稳定
  • 上下文污染:网页内容复杂,可能影响模型判断
  • 可解释性不足:用户难以理解 Skill 的具体执行逻辑

此外,安全与隐私也是关键问题:

  • Skill 是否会读取敏感页面信息?
  • Prompt 是否可能泄露用户数据?

这些都需要浏览器层面的权限与隔离机制支持。

结语:浏览器正在成为“最轻量的 AI 操作系统”

从引入 ,到推出 Skills,正在将 Chrome 从“浏览工具”升级为“AI 执行环境”。

这背后是一种更深层的趋势:AI 不再只是一个应用,而是嵌入所有应用的执行层。

当 Prompt 可以被保存、复用、点击执行,用户实际上已经在无意识中使用 Agent。而浏览器,则成为这些 Agent 最自然的运行场所。

对于开发者而言,这意味着一个新的构建空间正在出现——不是构建应用,而是构建“能力单元”。

20 次点击  ∙  0 人收藏  
登录后收藏  
0 条回复
关于 ·  帮助 ·  PING ·  隐私 ·  条款   
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
耗时 16 ms
Developed with Cursor