名称: content-moderation
描述: 通过 MCP 服务器使用 Vettly 内容审核 API 对文本、图像和视频进行审核。
metadata.openclaw: {"requires": {"env": ["VETTLY_API_KEY"], "bins": ["npx"]}}
使用 Vettly 基于 AI 的内容审核 API 审核用户生成的内容。此技能通过 @vettly/mcp MCP 服务器,依据可配置的审核策略(并提供可审计的决策)来检查文本、图像和视频。
将 @vettly/mcp MCP 服务器添加到您的配置中:
{
"mcpServers": {
"vettly": {
"command": "npx",
"args": ["-y", "@vettly/mcp"],
"env": {
"VETTLY_API_KEY": "your-api-key"
}
}
}
}
请在 vettly.dev 获取 API 密钥。
moderate_content根据 Vettly 审核策略检查文本、图像或视频内容。返回包含类别分数、采取的操作、使用的服务提供商、延迟和成本的安全性评估。
参数:
- content (必需) - 要审核的内容(文本字符串,或图像/视频的 URL)
- policyId (必需) - 用于审核的策略 ID
- contentType (可选,默认:text) - 内容类型:text、image 或 video
validate_policy验证 Vettly 策略 YAML 而不保存它。返回包含任何语法或配置错误的验证结果。用于在部署前测试策略变更。
参数:
- yamlContent (必需) - 要验证的 YAML 策略内容
list_policies列出您的 Vettly 账户中所有可用的审核策略。无需参数。在审核内容前,使用此工具来发现可用的策略 ID。
get_usage_stats获取您 Vettly 账户的使用统计信息,包括请求数、成本和审核结果。
参数:
- days (可选,默认:30) - 统计信息中包含的天数 (1-365)
get_recent_decisions获取最近的审核决策,可按结果、内容类型或策略进行筛选。
参数:
- limit (可选,默认:10) - 返回的决策数量 (1-50)
- flagged (可选) - 筛选仅标记的内容 (true) 或安全内容 (false)
- policyId (可选) - 按特定策略 ID 筛选
- contentType (可选) - 按内容类型筛选:text、image 或 video
请根据我的社区论坛策略审核此用户评论:
“我讨厌这个产品,这是我用过最差的东西,开发人员应该感到羞耻”
首先调用 list_policies 查找可用策略,然后使用相应的策略 ID 调用 moderate_content 并返回安全性评估。
验证此审核策略 YAML:
categories:
- name: toxicity
threshold: 0.8
action: flag
- name: spam
threshold: 0.6
action: block
调用 validate_policy 并报告任何语法或配置错误。
显示过去一周所有被标记的内容
使用 flagged: true 参数调用 get_recent_decisions 以检索最近被标记的审核决策。
list_policiesvalidate_policy 在生产环境部署前测试策略变更get_usage_stats 监控成本并发现意外激增contentType 或 policyId 筛选 get_recent_decisions 以缩小结果范围