OA0 = Omni AI 0
OA0 是一个探索 AI 的论坛
现在注册
已注册用户请  登录
OA0  ›  技能包  ›  openguardrails: 检测并拦截隐藏在长文本中的提示词注入攻击

openguardrails: 检测并拦截隐藏在长文本中的提示词注入攻击

 
  loadbalancer ·  2026-02-01 17:33:39 · 3 次点击  · 0 条评论  

name: moltguard
version: 6.6.17
description: "MoltGuard — 由 OpenGuardrails 为 OpenClaw 智能体提供的运行时安全插件。帮助用户安装、注册、激活和检查 MoltGuard 状态。当用户要求:安装 MoltGuard、检查 MoltGuard 状态、注册或激活 MoltGuard、配置 AI 安全网关,或了解 MoltGuard 检测内容时使用。提供本地优先的防护,抵御数据窃取、凭证盗窃、命令注入和敏感数据泄露。来源:https://github.com/openguardrails/openguardrails/tree/main/moltguard"
metadata: {"openclaw":{"emoji":"🛡️","homepage":"https://github.com/openguardrails/openguardrails/tree/main/moltguard","keywords":["security","prompt-injection","data-exfiltration","pii","credential-theft","command-injection","guardrails","safety","agent-security","moltguard"]}}


MoltGuard

OpenGuardrails 为 OpenClaw 智能体提供的运行时安全守卫。开源(Apache 2.0 许可证),完全可审计。

ClawHub: ThomasLWang/moltguard · npm: @openguardrails/moltguard · GitHub: openguardrails/openguardrails/tree/main/moltguard


安全性与来源验证

安装前请验证来源。 npm 包应与可审计的 GitHub 源码一致。验证方法:

# 下载并检查包内容
npm pack @openguardrails/moltguard --dry-run

# 或与克隆的仓库进行完整对比:
mkdir /tmp/moltguard-audit && cd /tmp/moltguard-audit
npm pack @openguardrails/moltguard
tar -xzf openguardrails-moltguard-*.tgz
git clone https://github.com/openguardrails/openguardrails
diff -r package/scripts openguardrails/moltguard/scripts

若对发布者信任度较低,建议从源码安装:openclaw plugins install -l ./openguardrails/moltguard

activate.mjs 的作用:https://www.openguardrails.com/core 发起出站调用以注册智能体。访问认领 URL 并验证邮箱后,返回的 API 密钥将写入 ~/.openclaw/credentials/moltguard/credentials.json。若不信任此端点,请勿激活。所有本地防护功能在未激活状态下仍可工作。

网络行为:
- 激活前:无出站调用。完全隔离的本地检测。
- 激活后:每次智能体工具调用会向 https://www.openguardrails.com/core 发送行为评估请求。不发送消息内容,仅发送工具名称、调用序列和元数据。

最小权限原则: 将激活写入的 API 密钥视为敏感信息。必要时可通过账户门户(https://www.openguardrails.com/core/login)轮换或撤销。只需不激活云端组件,即可永久保持纯本地防护。


安装前注意事项

安装或运行 activate.mjs 前,请确认:

1. 验证来源。
如上文“安全性与来源验证”部分所述,对比 npm 包与 GitHub 源码(使用 npm pack + diff)。仅当内容与您信任的源码一致时再继续。

2. 自行检查脚本。
scripts/activate.mjsscripts/status.mjs 简短易读。运行前请直接审阅。

3. 了解激活会写入什么。
激活会将一个 API 密钥写入 ~/.openclaw/credentials/moltguard/credentials.json。若后续不信任该端点,请删除此文件并通过平台门户撤销密钥。

4. 如需高保证,请在受监控环境中激活。
使用 tcpdumpmitmproxy 或 Little Snitch 等工具确认出站目的地,并验证负载仅包含脱敏的元数据,而非消息内容。

本地防护功能在未激活状态下完全可用 —— 无出站调用,无凭证写入。


智能体工作流程

检查状态

当用户询问 MoltGuard 状态、是否已注册或当前激活的邮箱/套餐时运行:

node {baseDir}/scripts/status.mjs

注册与激活

当用户希望注册 MoltGuard 或启用云端行为检测时运行:

node {baseDir}/scripts/activate.mjs

运行后,向用户展示认领 URL。告知用户访问该 URL 并提供邮箱以完成激活。成功后,API 密钥将写入 ~/.openclaw/credentials/moltguard/credentials.json —— 请通知用户,使其知晓凭证文件已创建。


安装

当用户要求安装 MoltGuard 时,执行以下步骤:

# 1. 安装插件
openclaw plugins install @openguardrails/moltguard

# 2. 重启网关以加载插件
openclaw gateway restart

# 3. 注册并显示激活链接
node {baseDir}/scripts/activate.mjs

运行第 3 步后,向用户展示输出中的认领 URL。告知用户访问该 URL 并输入邮箱以完成激活。

重启后本地防护立即生效 —— 无需注册。云端行为检测需要激活。

更新

# 1. 更新插件
openclaw plugins update moltguard

# 2. 重启网关以加载插件
openclaw gateway restart

# 3. 检查状态
node {baseDir}/scripts/status.mjs

更新后,运行第 3 步以确认插件已加载并显示当前激活状态。


MoltGuard 防护范围

本地防护(无需云端,无需注册):
- 读取敏感文件 → 网络调用 → 拦截
- 参数中的 Shell 逃逸($()、反引号、;&&|)→ 拦截
- 文件/网页内容中的提示词注入 → 就地脱敏

云端防护(需要激活):
- 多凭证访问、网页抓取后执行 Shell → 拦截
- 意图-动作不匹配、异常工具调用序列 → 告警

完整的检测表和模式详情,请参阅 references/details.md


AI 安全网关(免费,无需注册)

本地 HTTP 代理,在数据发送至 LLM 提供商前脱敏 PII/密钥:

npx @openguardrails/gateway   # 运行在 8900 端口

然后将您智能体的 API 基础 URL 指向 http://127.0.0.1:8900。可脱敏邮箱、信用卡、API 密钥、电话号码、SSN、IBAN、IP 地址、URL。在响应中恢复原始数据。无状态 —— 不保留任何数据。


配置

所有选项位于 ~/.openclaw/openclaw.jsonplugins.entries.openguardrails.config 路径下:

选项 默认值 描述
enabled true 启用/禁用插件
blockOnRisk true 检测到风险时拦截工具调用
apiKey "" 显式 API 密钥 (sk-og-...)
agentName "OpenClaw Agent" 仪表板中显示的名称
coreUrl https://www.openguardrails.com/core 平台 API 端点
dashboardUrl https://www.openguardrails.com/dashboard 用于观察报告的仪表板 URL
timeoutMs 60000 云端评估超时时间(毫秒)

要直接使用现有 API 密钥(跳过注册):

{
  "plugins": {
    "entries": {
      "openguardrails": {
        "config": { "apiKey": "sk-og-<your-key>" }
      }
    }
  }
}

套餐

套餐 价格 每月检测次数
免费 $0 30,000
入门版 $19/月 100,000
专业版 $49/月 300,000
商业版 $199/月 2,000,000

账户门户:https://www.openguardrails.com/core/login(邮箱 + API 密钥)


卸载

rm -rf ~/.openclaw/extensions/moltguard
# 从 ~/.openclaw/openclaw.json 中移除 moltguard 配置
rm -rf ~/.openclaw/credentials/moltguard   # 可选

参考

关于安全与信任、检测模式、隐私政策以及网关数据类型的详细信息,请阅读 references/details.md

3 次点击  ∙  0 人收藏  
登录后收藏  
目前尚无回复
0 条回复
About   ·   Help   ·    
OA0 - Omni AI 0 一个探索 AI 的社区
沪ICP备2024103595号-2
Developed with Cursor