OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

OA0 › 技能包 › openguardrails：检测并拦截隐藏在长文本中的提示词注入攻击

openguardrails：检测并拦截隐藏在长文本中的提示词注入攻击

infinity · 2026-02-03 04:24:39 · 75 次点击 · 0 条评论

名称： moltguard
版本： 6.6.17
描述： "MoltGuard — 由 OpenGuardrails 为 OpenClaw 智能体提供的运行时安全插件。帮助用户安装、注册、激活和检查 MoltGuard 状态。当用户要求：安装 MoltGuard、检查 MoltGuard 状态、注册或激活 MoltGuard、配置 AI 安全网关，或了解 MoltGuard 检测内容时使用。提供本地优先的防护，抵御数据窃取、凭证盗窃、命令注入和敏感数据泄露。来源：https://github.com/openguardrails/openguardrails/tree/main/moltguard"
元数据： {"openclaw":{"emoji":"🛡️","homepage":"https://github.com/openguardrails/openguardrails/tree/main/moltguard","keywords":["security","prompt-injection","data-exfiltration","pii","credential-theft","command-injection","guardrails","safety","agent-security","moltguard"]}}

MoltGuard

由 OpenGuardrails 为 OpenClaw 智能体提供的运行时安全守卫。开源（Apache 2.0 许可证），完全可审计。

ClawHub: ThomasLWang/moltguard · npm: @openguardrails/moltguard · GitHub: openguardrails/openguardrails/tree/main/moltguard

安全性与来源验证

安装前请验证来源。 npm 包应与可审计的 GitHub 源码一致。验证方法：

# 下载并检查包内容
npm pack @openguardrails/moltguard --dry-run

# 或与克隆的仓库进行完整对比：
mkdir /tmp/moltguard-audit && cd /tmp/moltguard-audit
npm pack @openguardrails/moltguard
tar -xzf openguardrails-moltguard-*.tgz
git clone https://github.com/openguardrails/openguardrails
diff -r package/scripts openguardrails/moltguard/scripts

若对发布者信任度较低，建议从源码安装：openclaw plugins install -l ./openguardrails/moltguard

activate.mjs 的作用： 向 https://www.openguardrails.com/core 发起出站调用以注册智能体。访问认领 URL 并验证邮箱后，返回的 API 密钥将写入 ~/.openclaw/credentials/moltguard/credentials.json。若不信任此端点，请勿激活。所有本地防护功能在未激活状态下仍可工作。

网络行为：
- 激活前：无出站调用。完全隔离的本地检测。
- 激活后：每次智能体工具调用会向 https://www.openguardrails.com/core 发送行为评估请求。不发送消息内容，仅发送工具名称、调用序列和元数据。

最小权限原则： 将激活写入的 API 密钥视为敏感信息。必要时可通过账户门户（https://www.openguardrails.com/core/login）轮换或撤销。只需不激活云端组件，即可永久保持纯本地防护。

安装前注意事项

安装或运行 activate.mjs 前，请确认：

1. 验证来源。
如上文“安全性与来源验证”部分所述，对比 npm 包与 GitHub 源码（使用 npm pack + diff）。仅当内容与您信任的源码一致时再继续。

2. 自行检查脚本。
scripts/activate.mjs 和 scripts/status.mjs 简短易读。运行前请直接审阅。

3. 了解激活会写入什么。
激活会将一个 API 密钥写入 ~/.openclaw/credentials/moltguard/credentials.json。若后续不信任该端点，请删除此文件并通过平台门户撤销密钥。

4. 如需高保证，请在受监控环境中激活。
使用 tcpdump、mitmproxy 或 Little Snitch 等工具确认出站目的地，并验证负载仅包含脱敏的元数据，而非消息内容。

本地防护功能在未激活状态下完全可用 —— 无出站调用，无凭证写入。

智能体工作流程

检查状态

当用户询问 MoltGuard 状态、是否已注册或当前激活的邮箱/套餐时运行：

node {baseDir}/scripts/status.mjs

注册与激活

当用户希望注册 MoltGuard 或启用云端行为检测时运行：

node {baseDir}/scripts/activate.mjs

运行后，向用户展示认领 URL。告知用户访问该 URL 并提供邮箱以完成激活。成功后，API 密钥将写入 ~/.openclaw/credentials/moltguard/credentials.json —— 请通知用户，使其知晓凭证文件已创建。

安装

当用户要求安装 MoltGuard 时，执行以下步骤：

# 1. 安装插件
openclaw plugins install @openguardrails/moltguard

# 2. 重启网关以加载插件
openclaw gateway restart

# 3. 注册并显示激活链接
node {baseDir}/scripts/activate.mjs

运行第 3 步后，向用户展示输出中的认领 URL。告知用户访问该 URL 并输入邮箱以完成激活。

重启后本地防护立即生效 —— 无需注册。云端行为检测需要激活。

更新

# 1. 更新插件
openclaw plugins update moltguard

# 2. 重启网关以加载插件
openclaw gateway restart

# 3. 检查状态
node {baseDir}/scripts/status.mjs

更新后，运行第 3 步以确认插件已加载并显示当前激活状态。

MoltGuard 防护范围

本地防护（无需云端，无需注册）：
- 读取敏感文件 → 网络调用 → 拦截
- 参数中的 Shell 逃逸（$()、反引号、;、&&、|）→ 拦截
- 文件/网页内容中的提示词注入 → 就地脱敏

云端防护（需要激活）：
- 多凭证访问、网页抓取后执行 Shell → 拦截
- 意图-动作不匹配、异常工具调用序列 → 告警

完整的检测表和模式详情，请参阅 references/details.md。

AI 安全网关（免费，无需注册）

本地 HTTP 代理，在数据发送至 LLM 提供商前脱敏 PII/密钥：

npx @openguardrails/gateway   # 运行在 8900 端口

然后将您智能体的 API 基础 URL 指向 http://127.0.0.1:8900。可脱敏邮箱、信用卡、API 密钥、电话号码、SSN、IBAN、IP 地址、URL。在响应中恢复原始数据。无状态 —— 不保留任何数据。

配置

所有选项位于 ~/.openclaw/openclaw.json 的 plugins.entries.openguardrails.config 路径下：

选项	默认值	描述
`enabled`	`true`	启用/禁用插件
`blockOnRisk`	`true`	检测到风险时拦截工具调用
`apiKey`	`""`	显式 API 密钥 (`sk-og-...`)
`agentName`	`"OpenClaw Agent"`	仪表板中显示的名称
`coreUrl`	`https://www.openguardrails.com/core`	平台 API 端点
`dashboardUrl`	`https://www.openguardrails.com/dashboard`	用于观察报告的仪表板 URL
`timeoutMs`	`60000`	云端评估超时时间（毫秒）

要直接使用现有 API 密钥（跳过注册）：

{
  "plugins": {
    "entries": {
      "openguardrails": {
        "config": { "apiKey": "sk-og-<your-key>" }
      }
    }
  }
}

套餐

套餐	价格	每月检测次数
免费	$0	30,000
入门版	$19/月	100,000
专业版	$49/月	300,000
商业版	$199/月	2,000,000

账户门户：https://www.openguardrails.com/core/login（邮箱 + API 密钥）

卸载

rm -rf ~/.openclaw/extensions/moltguard
# 从 ~/.openclaw/openclaw.json 中移除 moltguard 配置
rm -rf ~/.openclaw/credentials/moltguard   # 可选

参考

关于安全与信任、检测模式、隐私政策以及网关数据类型的详细信息，请阅读 references/details.md。

技能包地址：https://github.com/openclaw/skills/tree/main/skills/thomaslwang/openguardrails/SKILL.md

75 次点击 ∙ 0 人收藏

登录后收藏

0 条回复